RNA-seqを用いた遺伝子発現解析: 方法と応用

オミクス基礎知識

RNA-seqとは

RNA-seq(RNA-sequencing)は、次世代シーケンサーを用いて、細胞や組織中の遺伝子発現を、網羅的そして定量的に解析する手法です。RNA-seqは、遺伝子の発現定量だけではなく、未知のスプライシングパターンの検出、新たな遺伝子やnon-cording RNAの発見などに寄与し続けています。

RNA-seqの方法

RNA-seqの基本的な手順は以下の通りです。

1.RNAの抽出
対象となる細胞や組織から、total RNAを抽出します。この際、残存DNAを含まず品質の良いRNAを得るために、RNAの分解や劣化を防ぐ基本的な操作やDNase処理が重要となります。精製度も測定しましょう。目安としてのRIN値≧8とされることが多いですが、それより低いRIN値でもライブラリー調製は可能です。

2.ライブラリー調製
市販の様々なライブラリ調整キットが使用可能です。目的に応じて選択しましょう。cDNA合成や末端処理、アダプター付加、PCR増幅が行われます。作成されたライブラリの定量と定性を行い、品質の確認を行います。アダプターダイマーに注意しましょう。

3.シーケンス
次世代シーケンサーを用いて、作成されたライブラリのシーケンスを行います。
シーケンスデータは、研究目的に応じたカバレッジが求められます。

4.データ解析
シーケンスデータを参照ゲノムにマッピングし、遺伝子発現量を定量します。
さらに、遺伝子間や条件間の発現量の比較、遺伝子クラスタリングや機能解析を行います。

RNA-seqの応用

RNA-seqは、以下のような多様な応用が可能です。

遺伝子発現プロファイリング
細胞や組織の遺伝子発現パターンを精度良く定量的に解析できます。
発生過程や細胞の特性、疾患特異的な遺伝子発現状態などを明らかにします。

・スプライシング解析
RNA-seqにより、複数のスプライシングバリアントが同時に検出されるため、
オルタナティブスプライシングの解析が可能です。

・新規遺伝子・non-cording RNAの発見
未知の遺伝子領域や新たなnon-cording RNAを同定することができます。
これにより、新たな遺伝子機能やエピジェネティック制御機構の発見が期待されます。

RNA-seqデータの公共データベース

世界中の研究者が取得したRNA-seqデータがデータベース上で公開されており、研究成果の共有や、公開データを用いた新たな解析が可能となっています。以下は、RNA-seqデータを提供している主な公共データベースです。

NCBI GEO (Gene Expression Omnibus)
遺伝子発現データやその関連データを収集・保存・配布しているアメリカのデータベースです。

・EMBL-EBI ArrayExpress
ヨーロッパの遺伝子発現データベースで、マイクロアレイやRNA-seqデータが登録されています。

・DDBJ (DNA Data Bank of Japan)
日本の遺伝子情報データベースで、遺伝子配列情報や発現データが提供されています。

これらのデータベースを利用することで、研究者は公開されているデータを再解析したり、自身のデータと比較することで、新たな知見や研究の進展が期待できます。

RNA-seqデータの解析ツール

RNA-seqデータの解析には、さまざまなツールが使用されています。その中でも代表的なデータ解析ツールの一例を以下に示します。

HISAT2
RNA-seqデータを参照ゲノムにマッピングするためのツールです。スプライシングサイトを考慮したアライメントが可能です。

・featureCounts
マッピングされたRNA-seqデータから、遺伝子発現量を定量するためのツールです。データの正規化やバリアント検出などの追加解析もサポートしています。

・edgeR
RNA-seqデータの発現量比較解析を行うためのRパッケージです。遺伝子発現量のカウントデータから、遺伝子間や条件間の発現差を統計的に評価します。

これらのツールを組み合わせて使用することで、RNA-seqデータから遺伝子発現の情報を抽出し、さまざまな解析を行うことができます。また、オープンソースのソフトウェアやWebツールが多く開発されており、研究者は自身の研究目的に合わせて適切なツールを選択して使用することができます。

今後の展望

RNA-seq技術は、遺伝子発現解析の分野で革命的な影響を与えており、今後もその進化が続くと考えられます。シングルセルRNA-seqによる細胞レベルの遺伝子発現解析や、複数のオミックスデータを統合する多次元解析手法の発展により、より深い生物学的理解が得られることが期待されます。また、機械学習やAI技術との連携によるデータ解析手法の進化も、新たな遺伝子機能の発見や疾患診断・治療への応用に貢献していくでしょう。

レリクサのサービスなら

丁寧なビフォアサポート・アフターサポート
15名以上の博士研究者が在籍。高い専門性と丁寧なサービスで、最後までご満足いただけるサービスを提供します。

リーズナブルで高品質なシーケンス
競争力のある複数の国内外シーケンスプロバイダーと提携し、低価格・高品質なデータ取得を実現しています。データ解析をご自身で実施するお客様からも選ばれています。

カスタム実験・オーダーメイド解析・統合解析にも対応
ご研究目的やご要望の図版、参考文献等に応じて、標準サービスメニュー外のカスタム実験・カスタム解析・マルチオミクス解析・統合解析も承ります。

参考文献

Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool for transcriptomics. Nat Rev Genet. 2009;10(1):57-63. doi: 10.1038/nrg2484.

Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B. Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat Methods. 2008;5(7):621-8. doi: 10.1038/nmeth.1226.

Conesa A, Madrigal P, Tarazona S, et al. A survey of best practices for RNA-seq data analysis. Genome Biol. 2016;17:13. doi: 10.1186/s13059-016-0881-8.

Trapnell C, Williams BA, Pertea G, et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat Biotechnol. 2010;28(5):511-5. doi: 10.1038/nbt.1621.

株式会社Rhelixa(レリクサ)について

当社は最先端のゲノム・エピゲノム解析で培ってきた技術を活用して、生物学・医学・薬学領域における基礎研究や製品・ソリューションの開発、またはそれらの受託業務を行っています。次世代シーケンサーにより得られるエピゲノムデータの他、ゲノムやトランスクリプトーム、メタゲノムデータを組み合わせた統合的なデータ解析により、細胞制御の詳細なメカニズムの予測や精度の高いマーカーの探索を行います。また、研究開発のあらゆる場面で必要となるデータの統計解析や図版作成を基礎知識を必要とせず誰もが手元で実現できる環境を提供しています。