はじめに
ゲノム(DNA)シーケンスは、1970年代にはじまったキャピラリー電気泳動を用いるサンガーシーケンスに代表される第一世代シーケンス技術から始まり、シーケンスを並列して行い高速に配列を決定する第二世代のショートリードシーケンス技術へと進化してきましたそして、第三世代シーケンスとして、ロングリードシーケンスが登場しました。ゲノムの長い領域を一度に読み取ることができるこの技術は、高度に繰り返される配列や構造的変異の同定など、新しい研究を可能にしています。
本記事では、ロングリードシーケンスがもたらす革命的な利点と、このテクノロジーが今後どのように発展していくかについて解説します。
参考(次世代シーケンス技術の進化とバイオインフォマティクスの重要性)
ロングリードシーケンスの基礎
ロングリードシーケンス技術には、PCR増幅を行う事なく、リアルタイムに長い塩基配列のシーケンスを行える利点があります。第二世代シーケンス技術であるショートリードシーケンスは、DNAを非常に小さな断片に切断し、それぞれを個別にシーケンスします。これに対し、ロングリードシーケンスは数キロベースから数十キロベースにも及ぶ長いDNA断片を1塩基毎に直接読み取ることができるため、ゲノム内の構造的変異、長い繰り返し配列、高度に変異する領域をより正確に解析することができます。1分子シーケンスと呼ばれることもあります。
ロングリードシーケンス技術の主なプラットフォームには、Pacific Biosciences(PacBio)のSingle Molecule Real-Time (SMRT) シーケンシングとOxford Nanopore Technologiesのナノポアシーケンシングがあります。次にこれらの技術の仕組みを説明します。
ロングリードシーケンスの仕組み
PacBioのSMRTシーケンシングは、DNAポリメラーゼ酵素1分子が固定された数千個ものzero-mode waveguideを含むチップ上で行われます。固定されたポリメラーゼがDNAテンプレートを鋳型として取り込み、DNA合成を行います。このDNA合成時に、蛍光標識ヌクレオチドを用いて放たれた蛍光を検出することで、ヌクレオチドの取り込みをリアルタイムに測定します。このようにして1塩基ごとの配列決定が行われます。この方法は、ポリメラーゼの挙動から、DNAメチル化といった塩基修飾も直接検出可能な点も優れているとされています。
一方、Oxford Nanopore Technologiesのナノポアシーケンシングでは、DNA分子やRNA分子が膜に埋め込まれたナノポアを通過する際に起こる電気的信号を検出します。この方法では、蛍光色素やDNAポリメラーゼを使用せず、速やかにデータを得ることができます。また、DNAシーケンスだけでなく、RNAシーケンスにも利用可能であり、トランスクリプトームの分析にも用いられています。
ロングリードシーケンスの利点
ゲノムアセンブリの高精度化
従来のショートリードシーケンスでは、ゲノムの繰り返し領域や複雑な構造は正確に検出することは困難でした。数百塩基長しか得られないショートリードでは、ゲノム中に複数回現れるような繰り返し配列の位置関係を完全に決定することができないからです。ロングリードでは、これらの領域をカバーするような数キロから数十キロ塩基長の配列を提供し、ゲノムの包括的なマッピングとアセンブリを可能にします。
構造変異の網羅的な検出
大規模な挿入、削除、転座、および逆転は、遺伝病やがんなどの病態の理解において重要です。リファレンス配列にロングリード配列をアライメントすることで、直接的に構造変異を検出することができ、ショートリードシーケンスでは推定が難しいゲノムのダイナミクスを明らかにします。
全長トランスクリプトの解析
RNA-seqにおいても、トランスクリプト全体の正確な構造を解明するのに有効です。例として、従来のショートリードシーケンス技術では、短いリード長のためにスプライスバリアントの全体像を捉えることが困難でしたが、ロングリードによってこの問題が解消されます。
エピゲノム解析への利用
従来のバイサルファイト処理を必要とせず、SMRTシーケンシングではメチル化された塩基がポリメラーゼ反応速度に影響を与え、蛍光信号に変化が現れるためメチル化検出が可能です。ナノポアシーケンシングでも同様にメチル化を直接検出できるといわれています。リアルタイムかつ高感度にエピジェネティックな特徴を把握できることから、複雑なゲノム領域における病気のメカニズム解明や遺伝学的多様性の理解に貢献しています。
まとめ
ロングリードシーケンス技術の改善により、読み取りエラー率が徐々に低減しており、より高い精度でゲノムを解読できるようになっています。一方で、ショートリードシーケンスに比べて高コストであるという課題は残っています。しかし、このコストは技術の進歩と市場の成熟により、徐々に下がりつつあり、より多くの研究者にとってアクセス可能になってきています。
ロングリードシーケンスは、これからの生命科学の発展に不可欠なテクノロジーです。このテクノロジーが可能にする新たな発見は、私たちの健康、環境、さらには私たち自身の起源についての理解を深めることでしょう。この興奮するような未来の進化を目の当たりにしながら、その可能性を最大限に引き出す方法を見つけていくことが、私たちの科学コミュニティに与えられた挑戦であり続けます。
参考文献
Hu T, Chitnis N, Monos D, Dinh A. Next-generation sequencing technologies: An overview. Hum Immunol. 2021;82(11):801-811. doi:10.1016/j.humimm.2021.02.012
レリクサのサービスなら
丁寧なビフォアサポート・アフターサポート
15名以上の博士研究者が在籍。高い専門性と丁寧なサービスで、最後までご満足いただけるサービスを提供します。
リーズナブルで高品質なシーケンス
競争力のある複数の国内外シーケンスプロバイダーと提携し、低価格・高品質なデータ取得を実現しています。データ解析をご自身で実施するお客様からも選ばれています。
カスタム実験・オーダーメイド解析・統合解析にも対応
ご研究目的やご要望の図版、参考文献等に応じて、標準サービスメニュー外のカスタム実験・カスタム解析・マルチオミクス解析・統合解析も承ります。
株式会社Rhelixa(レリクサ)について
当社は最先端のゲノム・エピゲノム解析で培ってきた技術を活用して、生物学・医学・薬学領域における基礎研究や製品・ソリューションの開発、またはそれらの受託業務を行っています。次世代シーケンサーにより得られるエピゲノムデータの他、ゲノムやトランスクリプトーム、メタゲノムデータを組み合わせた統合的なデータ解析により、細胞制御の詳細なメカニズムの予測や精度の高いマーカーの探索を行います。また、研究開発のあらゆる場面で必要となるデータの統計解析や図版作成を基礎知識を必要とせず誰もが手元で実現できる環境を提供しています。