はじめに
次世代シーケンス技術の進化により、網羅的なデータ解析の重要性が高まっています。発現変動遺伝子(DEGs: Differentially Expressed Genes)に着目した解析が、DEG解析であり、ある条件間の発現変動遺伝子をRNA-Seqデータから検出する手法です。本記事では、DEG解析の基本原理と手法について解説します。
DEG解析の基本原理
DEG解析は、異なる条件下での遺伝子発現の変動を検出し、統計的に有意な差異を示す発現変動遺伝子を同定する手法です。この解析は、RNA-Seqやマイクロアレイなどの高スループット技術で得られた遺伝子発現データを用いて行われます。
具体的には、例えば疾患群と健康群、治療前と治療後など、異なる条件や時間点を持つサンプル間での遺伝子発現量を比較し、それらの差異が統計的に有意であるかどうかを検定し、発現変動が有意な遺伝子を抽出します。
DEG解析の最も一般的なアプローチは、統計的仮説検定を用いた方法です。統計モデルを用いて各遺伝子の発現量の差異を評価し、その差異がランダムに起こる可能性を評価します。一般的な統計検定手法には、t検定、Wilcoxonの順位和検定、負の二項分布モデルなどがあります。また、多重検定補正を行い、偽陽性率を制御することも重要です。
DEG解析における重要な概念の1つは、発現変動の閾値の設定です。通常、DEGとして扱われる遺伝子は、統計的に有意な差異を示す一定の閾値を超える遺伝子です。ただし、この閾値の設定は実験デザインや解析の目的によって異なる場合があり、系の特性に合わせて最適な閾値を設定することが肝要となります。
DEG解析の手法
DEG解析にはさまざまな手法・ソフトウェアが開発されています。R用のパッケージとしてDEseq2、edgeR、Limma-Voom が有名です。それぞれ、得られたリードカウントデータの正規化方法や、データのモデリングに使用する分布に違いがあり、得られるDEG解析結果が微妙に異なるものとなる事があります。自身の研究目的や条件、得られた結果に併せて、最適なパッケージを探索し利用する必要があります。
DEG解析の応用と展望
DEG解析は、異なる条件下での遺伝子発現の変動を明らかにするだけでなく、得られた発現変動遺伝子リストを用いたGO解析を行い、その変動が関与する生物学的なプロセスや経路を特定するのにも役立ちます。このような情報は、疾患の病態解明や治療標的の同定、さらなる研究の方向性の提案などに活用されます。
DEG解析は、次世代シーケンス技術がもたらす大規模な遺伝子発現データを解析するための重要な手法の1つです。その正確な実行と適切な解釈は、生物学の研究において不可欠なステップです。
レリクサのサービスなら
丁寧なビフォアサポート・アフターサポート
15名以上の博士研究者が在籍。高い専門性と丁寧なサービスで、最後までご満足いただけるサービスを提供します。
リーズナブルで高品質なシーケンス
競争力のある複数の国内外シーケンスプロバイダーと提携し、低価格・高品質なデータ取得を実現しています。データ解析をご自身で実施するお客様からも選ばれています。
カスタム実験・オーダーメイド解析・統合解析にも対応
ご研究目的やご要望の図版、参考文献等に応じて、標準サービスメニュー外のカスタム実験・カスタム解析・マルチオミクス解析・統合解析も承ります。
株式会社Rhelixa(レリクサ)について
当社は最先端のゲノム・エピゲノム解析で培ってきた技術を活用して、生物学・医学・薬学領域における基礎研究や製品・ソリューションの開発、またはそれらの受託業務を行っています。次世代シーケンサーにより得られるエピゲノムデータの他、ゲノムやトランスクリプトーム、メタゲノムデータを組み合わせた統合的なデータ解析により、細胞制御の詳細なメカニズムの予測や精度の高いマーカーの探索を行います。また、研究開発のあらゆる場面で必要となるデータの統計解析や図版作成を基礎知識を必要とせず誰もが手元で実現できる環境を提供しています。