解析手法入門 第1回 次世代シーケンサーの仕組み

NGSとは

これまで塩基配列決には、Maxixam-Gilbert法とSanger法(またはdideoxy法とも呼ばれる)が用いられていました。

Maxixam-Gilbert法では、DNAサンプルを化学的に分解し、配列に重なりのある断片を比較して配列を決定します。また、Sanger法(didoxy法)では、DNAサンプルを鋳型としてDNAを合成する際にジデオキシヌクレオチド三リン酸(ddNTP)を取り込むと合成が停止する原理を利用して塩基配列決定を行います。

現在のシークエンサーはSanger法を応用しており、ddNTPを異なる色の蛍光色素で標識することで、自動的に配列決定を行うものが主流となっています。しかしこのシークエンサーは一度に解析可能なDNA数に制限があるという問題点があります。

これに対して、高速にかつ大量のDNA塩基配列決定を行うことのできるシークエンサーは、〝次世代〟シークエンサーと呼ばれています。従来のシークエンサーと比較すると、大量の配列データをより安価に得ることが可能です。

NGS実験のフローチャート

  1. Sequencing:DNAサンプルの塩基配列をNGSにより解読
  2. 一次解析:イメージングにより得られた生データを断片的な配列データに変換
  3. 二次解析:断片的に得られた大量のデータを組み合わせ、全ゲノムデータを作成 例)アッセンブリ、マッピング
  4. 三次解析:全ゲノムデータをもとに各種の解析 例)SNP解析、ピークコール
  5. 様々な関連データ(アノテーション)のついた全ゲノムデータの取得

NGS実験の詳細なプロトコル

上記のNGS解析フローチャートのSequencingから二次解析までの具体的な原理とそれを利用する代表的な次世代シークエンサーを紹介します。

NGSによって全ゲノムの配列データを得るには、テンプレートの調製、シークエンシング・イメージング、二次解析にあたるゲノムのアセンブリ・アノテーションの過程が必要です。

 

・テンプレートの調整

テンプレート調整には、事前にPCRを行い、DNAサンプルを増幅しておく方法と事前のPCRを必要としない方法があります。

いずれの方法においても、NGSでは、テンプレートが固体表面または支持体に固定されるため、数千から数十億の塩基配列決定を同時に行うことができます。

Clonally amplified templates(事前にPCRを行う方法)

・エマルジョンPCR

DNAサンプルは断片化され、DNA断片の両端にはアダプター配列が付加されます。このアダプターはPCRを行う足場に結合する際に利用されます。

アダプターが付加されたDNAは、PCR反応が行われるビーズの表面に結合します。

DNA断片-ビーズ複合体、プライマー、酵素、バッファー、エマルジョンオイルが混合したエマルジョン溶液内で、PCR反応を行い、ビーズ上でDNAを増幅させます。この増幅方法は、Life/AGPのPolonatorやRoche/454で利用されています。

 

・Solid-phase amplification

フローセルというガラスの基板上のオリゴとアダプター付きDNA断片が結合し、Bridge PCRによってDNAが増幅します。Bridge PCRでは、基板に結合していないフリーのアダプターが近くのオリゴに結合するとDNAがアーチを形成し、DNAは2本鎖に増幅されていきます。PCRサイクルが増えるに従い、基板上にクラスターが形成します。この原理は、Illumina/Solexaで利用されています。

 

Single molecule templates(事前のPCRを必要としない方法)

単分子シークエンシングは、必要なサンプル量が約1 μgと少ない材料で済み、PCRによる事前のDNA増幅を必要としないことが特徴です。

単分子テンプレート調整においても、支持体上にテンプレートDNAを固定する必要があります。

HeliScope/HelicoBioScienceは、アダプター付きDNAと支持体上に固定化したプライマーのハイブリダイズする原理を利用しています。また、Pacific BioSciencesは、基板上に固定化したポリメラーゼ分子にDNAが結合することを利用して固定化を行います。

・シークエンシング

実際に塩基配列を読み込む過程で、大きく4つの方法に分類されています。

・Cyclic revers termination (CRT):可逆的ターミネーター法

可逆的ターミネーターは、リボース3’位(ポリメラーゼによるDNA合成反応の際、デオキシヌクレオチドのリン酸が結合する位置)にアリル化物が結合したヌクレオチドで、DNAに結合するとDNAの伸長を停止させるが、アリル基を外すとDNA合成が可能となります。可逆的ターミネーターには塩基ごとに異なる蛍光色素が標識されており、反応の停止位置にある塩基を把握することができます。これにより塩基配列決定を行います。蛍光色素の検出はTIRFイメージングによって検出されます。この原理を利用しているのが、Illumina/Solexa、HeliScope/HelicoBioScienceです。

Illumina/Solexaは、変異同定、mRNA配列決定、再Sequencingに向いていますが、新規ゲノム配列決定には向いていないという特徴があります。

・Sequencing by ligation (SBL)

DNAに結合するオリゴヌクレオチドの配列を利用して塩基配列を決定します。SBLでは、DNAサンプルとオリゴヌクレオチドの結合にDNAリガーゼを利用しています。8塩基オリゴヌクレオチドのうち、先頭から2塩基は蛍光色素で標識され、次の3塩基はランダムな配列、さらにその次の3塩基はどの塩基にもハイブリダイズ可能な塩基で構成されています。

この原理は、Life/APGのSOLiD、Polonatorで利用されています。

Life/APGのSOLiDは一度に解析可能な塩基数が短いため、新規ゲノム解析には向きませんが、再Sequencingに適応します。

・Pyrosequencing:パイロシークエンシング

DNA合成反応でヌクレオチドが取り込まれる際に放出するピロリン酸にATPスルフリラーゼを作用させ、ATPに変換します。その後、ルシフェラーゼ/ルシフェリン反応系を利用して生物学的発光を検出します。

この原理は、Roche/454で利用されています。

一度に読める塩基配列が約500塩基と長いため、データをつなぎやすく、大規模な配列解析が可能です。一方で、同じ塩基配列が長く続いた場合、DNA合成が不均一になる点、反復配列の読み込みができない点などのデメリットがあります。

・Real-time sequencing:リアルタイムシークエンシング

Zero-mode waveguides (ZMW)という細孔の底部にDNAポリメラーゼが固定化されており、蛍光標識されたヌクレオチドでDNA合成を行います。ZMWへのDNAポリメラーゼ固定化により、弱い蛍光の検出が可能となっています。

この原理を利用しているのは、Pacific Biosciencesで、一塩基を解析する時間が短く、解析能力は非常に優れています。

・アラインメントとアセンブリ

NGSにより読み取られた塩基配列のデータは、既知の参照ゲノム配列に配列されて解析される場合と、ゲノムの塩基配列をde novo(新規に)組み立てることに使用される場合があります。

アラインメント

既知の参照ゲノム配列と塩基配列データを比較し、同じ塩基配列を持つ部分に配列させます。

 

de novo assembly

アラインメント用の参照ゲノム配列がない(ゲノムが解読されていない)生物種の場合は、種々のゲノム情報を利用せずに新規のゲノム配列を組み立てます。

NGSによる全ゲノム解析と予算の関係性

NGSによる個人の全ゲノム配列決定にかかるコストは急激に減少しています。しかし、大規模なゲノム解析研究においては依然としてコストの問題は大きいままです。そこで、現在では関心のある標的配列を濃縮する〝Genome Enrichment〟に基づき、全ゲノム配列決定にかかるコストや労力を減らすことができる様々なアプローチが検討されています。利用されている方法として、Microdroplet PCR、Solid-phase caputureやSolution-phase captureなどがあります。

 

参考論文

Nature Reviews Genetics 11, 31–46 (2010)

 

参考文献

遺伝子工学の原理 編者 藤原伸介 三共出版 2012年 p35~p46