NGSデータの情報解析

ゼロからデザインするNGSデータ解析のハンズオンサポート

次世代シーケンサー(NGS)を用いたゲノム・エピゲノム解析により、全ゲノム領域から疾患リスクや標的因子、その作用機序までを網羅的かつアンバイアスに予測することが可能です。それぞれの目的に応じて有効な実験・情報解析は異なり、どのようなデザインや計画を組むかにより研究の発展・成功の確度が変わってきます。株式会社Rhelixaでは、豊富な知識・ノウハウを持った専門スタッフにより、NGSを用いた基礎・臨床研究において、そのデザインから、実験や情報解析、結果の解釈、成果の発表・論文化までをハンズオンでサポートします。

トランスクリプトーム解析 (モデルケース)

1. 参照論文

High-temporal-resolution view of transcription and chromatin states across distinct metabolic states in budding yeast

(Nat Struct Mol Biol. 2014 Oct;21(10):854-63. doi: 10.1038/nsmb.2881. Epub 2014 Aug 31.)

2. データ概要

連続的なグルコース制限条件下では、出芽酵母は、遺伝子発現の活性変動に伴う頑強な代謝サイクルを示す。一方で、そのような変動がクロマチン状態の変化にどのように関連しているかは十分に理解されていない。リボソームの生合成などの特定の細胞プロセスに由来する成分が高度に調整された状態で利用可能になる「ジャストインタイムサプライチェーン」のメカニズムを明らかにすることを目的とし、酵母の代謝サイクルを16ポイントに分け11種類のエピゲノムデータ(転写因子結合、ヒストン修飾、遺伝子発現を含む)が取得された。

3. S. cerevisiaeゲノムへのマッピング・FPKM計算

11種類のChIP-seqおよびRNA-seq実験によって得られたリードデータ(fastq形式,シングルエンド)に対して、参照ゲノム「S288C(Saccharomyces Genome Database(http://www.yeastgenome.org/)より取得)」に対して、ChIP-seqデータはbowtie2、RNA-seqデータはtophat2を用いてマッピングを行った。RNA-seqデータにおいてFPKM(Fragments Per Kilobase Of Exon Per Million Fragments Mapped)を取得する際には、CuffLinksを用いた。