解析手法入門 第4回 ATAC-seqの原理と応用

ATAC-seqとは

 

現在、ゲノムワイド解析として、オープンクロマチン領域、DNA結合タンパク質の結合領域、ヌクレオソームの位置、およびゲノム位置間の相互作用を明らかにすることができます。

オープンクロマチン領域を探索するゲノムワイド解析の手法には、FAIRE-seqやDNase-seqなどが知られています。

しかし、これらの方法では、初期サンプル量が数千から数百万の細胞を必要としたり、細胞集団の不均一性を失ってしまったりと様々な欠点を生じます。加えて、クロマチンアクセシビリティと転写因子(TF)結合を同時に調べることができません。

ATAC-seqは、これまでの技術よりも安定しておりかつ高感度です。

 

この記事では、Nature Methods volume 10, pages 1213–1218 (2013)の内容をもとにATAC-seqについて解説していきます。

ATAC-seqの原理

ATAC-seqは、Assay for Transposase-Accessible Chromatin Sequencingの略称です。

ATAC-seqには、トランスポゼースと呼ばれる酵素を用います。トランスポゼースは、ゲノムDNAを断片化すると同時に、それらの断片にシーケンス用のアダプターを結合させます。この反応は、トランスポゼースが結合できるオープンクロマチン領域(転写が活性化されている領域)でのみ選択的に起こります。

得られたDNA断片にはあらかじめシーケンシングアダプターがタグ付けされているため、そのままシーケンスを行うことができます。シーケンスされたDNA配列をマッピングすることにより、オープンクロマチン領域の位置を調べることができます。

実験スタート時の必要サンプル量は、500~50,000個程度で、実験の所要時間は半日以下と、これまでの技術と比較して非常にコンパクトです。

ATAC-seq挿入サイズはヌクレオソームの位置を明らかにする

ATAC-seqをペアエンドリードシーケンスで行うことにより、ヌクレオソームの位置に関する詳細な情報を得ることができます。

ペアエンドリードシーケンスとは、DNA断片の両端をシーケンスする方法で、クオリティの高いシーケンスデータを得ることができます。

この論文では、ATAC-seqを用いてGM12878細胞株(ヒトリンパ芽球系細胞株)のヌクレオソームの位置を調べました。

このとき、MNase-seq(40億シングルエンドリード)はすべてのヌクレオソームを検出するのに対して、ATAC-seq(1.98億ペアエンドリード)から生成されたリードは遺伝子発現制御領域にヌクレオソームに集中していました。MNase-seqと比較して、ATAC-seqは遺伝子発現制御領域にあるヌクレオソームを検出するのにより適していると言えます。

ATAC-seqはヌクレオソーム-TF間隔のパターンを明らかにする

ATAC-seqから得られたヌクレオソームの高解像度マップは、ヌクレオソームとDNA結合因子との関係を理解することにも役立ちます。

ChIP-seqのデータから得られたDNA結合因子の位置を、最も近くにあるヌクレオソームの位置を基準にプロットしました。クラスタリング解析を行うと、DNA結合因子は、ヌクレオソームから離れてDNAに結合する因子(C-FOSなど)、ヌクレオソームのすぐ横に並んで結合する因子(CTCFなど)、ヌクレオソームにオーバーラップして結合する因子(クロマチンリモデリング因子など)、などに分けられることがわかりました。

ATAC-seqフットプリントでDNA結合因子の占有をゲノムワイドに推定できる

DNA結合因子が直接結合(占有)している部分はトランスポゼースが反応できないことから、ATAC-seqのシーケンス結果がDNA結合因子の存在を表す「フットプリント」になります。例えば、DNA結合因子であるCTCFの結合部位に、明確なフットプリント(ATAC-seqシグナルの谷)が見られました。

ATAC-seqを用いたフットプリント解析は、ChIP-seqの結合データやDNaseによるDNA結合因子の占有位置の推定と良く一致しており、ATAC-seqによるDNA結合因子の占有位置のデータが遺伝子発現制御ネットワークの解析に役に立つことが考えられます。

ATAC-seqは臨床応用が期待されている

ATAC-seqは、少数の細胞で迅速に豊富な情報を得ることができます。そのため、臨床において「個別化エピゲノミクス」を実現する有力なツールになるかもしれないと筆者らは考えています。

臨床応用が可能であることをテストするために、健常人から得られた血液サンプルを採取してT細胞(免疫細胞の一種)のエピゲノム解析を行いました。その結果、採血から解析までに要した時間は約275分、臨床で十分適用可能なほどの短時間でした。

次に、個人のエピゲノム情報からどのような遺伝子発現制御の情報を得られるかを検証するため、IL2遺伝子近傍を例に取ってある人のATAC-seqプロファイルを調べました。IL2遺伝子がコードするIL-2は、T細胞の増殖、あるいは炎症や自己免疫疾患におけるT細胞の機能を促進する代表的な因子です。IL2のエンハンサーに結合する種々の転写因子(NFAT, IRF4, STAT3など)を阻害する治療薬はそれぞれあります。ところが、基本的には、その患者さん個人のケースでIL2の発現が促進されている原因となっている転写因子を特定して阻害し、他の転写因子を標的とする余計な治療薬を使いたくないのが理想です。上述の人のATAC-seqデータを調べた結果、IL2の発現制御に関わるエンハンサー領域のうち、オープンになっているのはNFATが結合する領域だけでした(つまり、STAT3やIRF4はこの時点ではIL2の発現を促進するのにあまり関わっていないことがわかります)。

ATAC-seqフットプリントの解析や、アレル特異的なオープンクロマチン領域を特定すると言ったような高次解析も臨床的知見を与えるうることが提唱されています。

まとめ

ATAC-seqは、少ないサンプル数で迅速簡便に多くの情報を得ることができます。FACSやLaser capture microdissection (LCM)、あるいはRNA-seqといった技術と組み合わせて解析することも可能です。

特筆すべきは、臨床的な「個別化エピゲノミクス解析」を可能にするツールとなるかもしれないことです。FACSと組み合わせて特定の細胞集団だけを解析できますし、様々な疾患環境下で解析を行うこともできます。

ATAC-seqのスピード・単純さ・インプットの少なさは、生物学・医学の分野で遺伝子発現制御に関する新たな知見を生み出すことを可能にします。

参考論文

Nature Methods volume 10, pages 1213–1218 (2013)

 



— Decoding Life, Creating Future —

エピゲノムで生き物のあたり前を超えていく

Rhelixaはコアコンピタンスであるエピゲノム解析技術を応用し、ソフトウェアや検査技術の開発、それぞれの目的に応じた研究開発のサポートを行っています。

効率的かつ効果的なエピゲノム解析を実現する上で、網羅的な大規模遺伝情報の取得が必要になります。その際、最先端のゲノム配列決定装置である次世代シーケンサーが欠かせません。Rhelixaでは次世代シーケンサーを使用するための専門のラボ、人材、ノウハウが揃っており、更にそれより得られたデータを解析するためのソフトウェア、人材、ノウハウが揃っています。