株式会社Rhelixaと九州大学医学研究院・発生再生医学分野の沖真弥助教は、同助教が中心となり開発されたエピゲノム統合データベース「ChIP- Atlas」の機能拡張に向けた共同開発を開始しました。
【概要】
ChIP- Atlasは公共に存在する多数のChIP-seqデータを同時比較し、特定の細胞状態における転写因子の共同作用やその結合領域の特徴を解析することが可能です。Rhelixaはその機能拡張に向け、以下の2つのパイプラインを構築します。1)シーケンシング技術の向上により、今後とも世界中でChIP-seqデータが増え続けることが予想され、それらデータをどのようにChIP- Atlasに取り込んでいくかが課題となります。それに備え、Rhelixaは自然言語処理と機械学習を用いたキュレーション作業の半自動化、およびそのパイプライン構築を行います。2)さらに、ChIP-seqデータだけでなく、bisulfite sequencingデータも解析可能にするための専用解析パイプラインを構築します。
【期間】
2017年9月1日 〜 2018年2月28日
【内容】
(1)自然言語処理に基づくメタ情報修正プログラムの実装と組み込み
(2)Bisulfite sequencingデータ処理パイプラインの実装と組み込み
【業績に与える影響】
ChIP- Atlasの機能拡張により、今後より多数かつ多種類のエピゲノムデータが効率的に集積され、それらを同時に比較することが可能になります。それにより、ChIP- Atlasを通じて最新のエピゲノムデータが様々な現場で活用され、新たなエピゲノム研究を生み出す起点となっていくことが期待されます。