ゲノムの基礎知識
ゲノム genome とは、gene (遺伝子) +chromosome (染色体) あるいは -ome (オーム、総体)から合成された造語で、それぞれの生物を形作る上で必要な遺伝情報全体のことを指します。ゲノムの本体はDNA(デオキシリボ核酸)という巨大な分子で、リン酸と糖(デオキシリボース)、そしてA (アデニン) / T (チミン) / C (シトシン)/ G (グアニン) という4種類の塩基が連なった構造をしています。この配列の中で、生物の体において機能的な役割を果たす産物が生成される領域を遺伝子と呼びます。一般的には、mRNAが合成され(=転写)、アミノ酸配列から最終的にタンパク質が合成(=翻訳)される領域を遺伝子と呼びます。そして遺伝子から機能産物が生成される事を遺伝子発現と呼んでいます。
さて、ヒトのゲノムは約32億の塩基対(3.2Gbp)から成り立っています。遺伝子は約2万から2万5千あると言われていますが、ゲノム約3.2Gbpのうち遺伝子領域は約25%しかありません。さらに実際にタンパク質をコードする成熟型mRNA分子となるエクソン領域は約1.5%、すなわち3.2Gbp x 1.5% = 45Mbpです。エクソン領域を除いた約98.5%、つまりゲノムのほとんどを占める部分はタンパク質をつくらず、 それらの領域は非コード領域と呼ばれています。
この非コード領域は、遺伝子発現に重要な役割を果たしている事が明らかとなっています。プロモーターやエンハンサーといった転写のオンオフや転写効率の調整を担う領域や、タンパク質に翻訳されない non-cording RNA (ncRNA)が転写される領域が含まれています。ncRNAは15万以上の種類が存在していると推定されており、エピジェネティクスを介した遺伝子発現制御や、RNA干渉(RNA interference:RNAi)と呼ばれる転写後の遺伝子発現抑制など、さまざまな役割を果たしています。ncRNAはがんでは頻繁に異常発現している事から、バイオマーカーや治療標的として期待されています。
ヒトにおいてゲノム配列の個人差はどのくらいあるのでしょうか。ゲノム配列は個人個人で異なり、配列がリファレンスゲノムと一塩基のみ異なる一塩基多型は約400万、それより大きな構造多型は約数万ヵ所程度あると報告・推定されています。一塩基多型のうち、集団内で1%以上の頻度で見られる一塩基多型を特にSNP (single nucleotide polymorphism)と呼びます。これらの多型と疾患、身長・体重といった形質との関係性が着目されており、全ゲノムシークエンスでのデータ取得法や多型の検出の技術向上、得られた結果のデータベースへの登録は注目される分野のひとつとなっています。
本来、生まれてから変わらないはずの塩基配列に外界の影響により後から変化が生じることがあります。その変化の原因はどのようにして生じるのでしょうか。放射線や紫外線、化学物質といった外的要因以外に、DNA複製時のエラーといった内的要因も原因として挙げられます。体細胞分裂時にDNAの複製が行われますが、そのスピードは、1秒間に1,000bpというきわめて速いスピードです。それにも関わらず、変異率は1回の複製につき100億bpあたり1個という正確さであり、約32億bpのヒトゲノムでは、1回の複製で変異は生じないか、あってもごく数個のレベルしか見られない事になります。これは修復機構が存在するからです。しかしこの修復機構に異常が生じると、遺伝子変異が導入されやすい状態となり、がんに代表されるような疾病発症の原因となります。
このように、ゲノムには多様性があり、その多様性が個人の多様性や疾患発症リスクにつながっているのです。
ゲノム解析の重要性
ゲノム解析とは、DNAの塩基配列を読み取り、その情報を解析するプロセスです。これにより、遺伝子の構造や機能、さらには遺伝的または後天的な変異を特定することができます。ゲノム解析は、医療や生物学の分野で非常に重要な役割を果たしており、個別化医療や疾患の理解に大きな貢献をしています。
全ゲノムシーケンシング(WGS)とは?
全ゲノムシーケンシング(Whole Genome Sequencing, WGS)は、ゲノム解析の中で最も包括的な方法の一つです。WGSは、DNAの全塩基配列を一度に解析し、ゲノム全体の完全な地図を作成します。これにより、個々の遺伝子や特定の変異だけでなく、ゲノム全体の構造と機能を網羅的に理解することができます。
WGSのプロセス
- DNAの抽出: WGSの最初のステップは、検体(血液、唾液、組織など)からDNAを抽出することです。抽出されたDNAは、シーケンシングのために準備されます。
- シーケンシング: 抽出されたDNAは、次世代シーケンシング技術(NGS)を用いて、塩基配列の特定が行われます。NGS技術により、DNAの全塩基配列が高速かつ高精度で読み取られます。
- データの組み立てと解析: 得られたシーケンシングデータは、コンピューターを使って、リファレンスゲノムと比較を行いながら、あるいは、リファレンスの無いde novo シーケンスとして工夫しながら、パズルのように元のゲノム配列に組み立てられます。これは、数十億の塩基を正しい順序で並べ直し、ゲノムの全体像を再構築するプロセスです。
全ゲノムシーケンシングで何がわかるのか?
全ゲノムシーケンシングは、以下のような情報を提供します:
- 遺伝的変異の検出: WGSは、ゲノム全体を解析するため、特定の遺伝子や変異だけでなく、ゲノムのあらゆる部分に存在する変異を検出します。これには、小さな塩基置換や挿入・欠失、大規模な構造変異やコピー数変異も含まれます。
- 疾患のリスク評価: 特定の遺伝的変異が、特定の疾患や状態のリスクを高めることがあります。WGSを通じて、これらの変異を特定し、疾患リスクの評価に役立てることができます。
- 遺伝的多様性の理解: WGSは、個々のゲノムの違いを明らかにすることで、遺伝的多様性を理解する手助けをします。これは、人々が病気にかかりやすい理由や治療に対する反応の違いを理解するために重要です。
- 新たな治療法の開発: ゲノム全体の解析から得られる情報は、新しい治療法の開発に役立ちます。特に、遺伝的要因が関与する病気に対する個別化治療法の開発に貢献します。
- 新規生物の同定: de novo シーケンスにより、参照となるリファレンスゲノムが無い新規生物種の全ゲノム配列を入手する事ができます。ウイルスを含む新規生物の同定や、生物の進化の理解に役立ちます。
まとめ
ゲノムとその解析は、生命科学と医療の分野で革命的な変化をもたらしています。全ゲノムシーケンシングは、ゲノム全体を網羅的に解析し、私たちの健康や病気に関する重要な情報を提供します。これにより、希少疾患の診断や個別化医療の進展、病気の予防策の開発など、幅広い分野での応用が期待されます。今後も、この技術の進化により、ヒトに限らず様々な生物種で、さらに多くの発見と可能性が広がることでしょう。
レリクサのサービスなら
丁寧なビフォアサポート・アフターサポート
15名以上の博士研究者が在籍。高い専門性と丁寧なサービスで、最後までご満足いただけるサービスを提供します。
リーズナブルで高品質なシーケンス
競争力のある複数の国内外シーケンスプロバイダーと提携し、低価格・高品質なデータ取得を実現しています。データ解析をご自身で実施するお客様からも選ばれています。
カスタム実験・オーダーメイド解析・統合解析にも対応
ご研究目的やご要望の図版、参考文献等に応じて、標準サービスメニュー外のカスタム実験・カスタム解析・マルチオミクス解析・統合解析も承ります。
株式会社Rhelixa(レリクサ)について
当社は最先端のゲノム・エピゲノム解析で培ってきた技術を活用して、生物学・医学・薬学領域における基礎研究や製品・ソリューションの開発、またはそれらの受託業務を行っています。次世代シーケンサーにより得られるエピゲノムデータの他、ゲノムやトランスクリプトーム、メタゲノムデータを組み合わせた統合的なデータ解析により、細胞制御の詳細なメカニズムの予測や精度の高いマーカーの探索を行います。また、研究開発のあらゆる場面で必要となるデータの統計解析や図版作成を基礎知識を必要とせず誰もが手元で実現できる環境を提供しています。