エピゲノム統合解析プラットフォーム

RyuGooシステムの開発

Rhelixaの開発した「RyuGooシステム」は、次世代シーケンサーより得られたエピゲノムデータの統合解析プラットフォームです。RyuGooは専属の計算生物学者のように、利用者の目的とデータに合わせた最適な情報解析を実現します。RyuGooエンジンは、以下の3つの機能で構築されています。

  1. エピゲノムデータの特徴量抽出:独自の機械学習アルゴリズムにより、対象となるエピゲノムデータの性質や精度を規定する特徴量を抽出します。
  2. 解析パイプラインの自動構築:データの特徴量に基づき、最適な解析パイプラインを自動で構築します。
  3. 高圧縮のデータ保管:独自の圧縮アルゴリズムにより、大容量のエピゲノムデータをコンパクトに収容・移送します。

PEAKS on Illumina Basespace

次世代シーケンサーの製造や販売、開発において世界で最大のシェアを持つイルミナ社が運用するクラウドシステム「Basespace」上に、ATAC-seqデータ解析用としては世界初のパイプラインとして「PEAKS.motif」を実装し、テスト稼働を開始しました。

PEAKS.motifではインプットされたATAC-seqデータに対して、優位なATAC-seqシグナル領域(主にエンハンサー/プロモーター)を絞り込み、その領域群に濃縮される転写因子のモチーフ配列を抽出します。モチーフ配列のパターンより、転写因子とそれらの間の関連性を予測します。

De novo配列モチーフ解析結果例:ATAC-seqピーク領域の配列データのみを用いたパターン抽出

結合モチーフのデータベース検索:既知の転写因子結合モチーフを出現優位性に基づき比較

転写因子結合モチーフの同時出現割合:de novo配列モチーフの同時出現優位性を評価

エピゲノム専用解析システムの実装

rGadgetsの開発

エピゲノム研究の様々な場面で、高次元データを効果的に解釈するための解析・可視化が必要となります。しかしながら、それには高度なプログラミング能力や解析環境を要すため、限られた研究者のみ利用できるものでした。Rhelixaは、主成分分析や回帰分析、ヴァイオリンプロット描画やヒートマップ描画まで、webブラウザベースで簡単に高次元データの解析・可視化を行うことのできるプラットフォーム「rGadgets.graphics」を開発しました。

rGadgets.graphicsの利用は→こちらより、使用マニュアル(rGadgets-graphicsマニュアル第1版.pdf)は→こちらよりダウンロード出来ます。

特定の細胞状態を維持・変化させている特定遺伝子や遺伝子群の絞り込みや、サンプル間の関連性を予測する上でRNA-seqデータやマイクロアレイデータを用いたトランスクリプトーム解析が有効です。これまで、それらゲノムワイドなトランスクリプトームデータに対して統計解析やクラスタリング解析を行うには、専用の計算システムを導入し、専門の生命情報科学者による操作が必要でした。rGadgets.targetsはwebベースで簡単にトランスクリプトームデータの高次解析を可能とし、生物学者による機能解析を加速させます。

rGadgets.targetsの利用は→こちらより、使用マニュアル(rGadgets-targetsマニュアル第1版.pdf)は→こちらよりダウンロード出来ます。

ChIP-Atlasの機能拡張

エピゲノム統合データベース「ChIP-Atlas」の機能拡張に向け、メイン開発者である九州大学医学研究院・発生再生医学分野の沖真弥助教と共同開発を行いました。ChIP-Atlasは公共に存在する多数のChIP-seqデータを同時比較し、特定の細胞状態における転写因子の共同作用やその結合領域の特徴を解析することが可能です。Rhelixaは、1)自然言語処理と機械学習を用いたキュレーション作業の半自動化、およびそのパイプライン構築、2)bisulfite sequencingデータの専用解析パイプラインの構築と組み込みを行いました。

(ChIP-Atlasの利用はこちらから。)

遺伝情報に基づく検査の開発

ペット用遺伝子検査の開発

肥満関連遺伝子であるADRB3GPR120の多型に基づいたイヌの肥満体質遺伝子検査を開発しました。本検査は日本ペット総合研究所株式会社にて販売されます。近日更に、遺伝情報に基づいた歯周菌や腸内フローラの検査をリリースします。Rhelixaは遺伝情報に基づく新たな検査を確立します。