解析手法入門 第6回 DNAメチル化解析の原理と応用

“第5の塩基”としてのメチル化シトシン

~メチル化DNAをゲノムワイドに検出する~

 

DNAメチル化は、発生、ゲノムインプリンティング、転移因子(トランスポゾン)のサイレンシング、遺伝子の転写制御など、多くの生物学的プロセスに関与しています。

近年では、ハイスループットDNAシーケンシング技術の劇的な進歩により、DNAメチル化部位を一塩基解像度で全ゲノム領域に渡ってマッピングすることが可能になりました。

 

かつては、1000塩基対以内に位置するCqGのメチル化状態が有意に相関していることが示されたことから、一塩基解像度でメチル化DNAの位置を決定することが必要なのか?という問題が提起されたことがありました。

しかし、転写因子などのDNAへの結合がDNAのメチル化状態に左右されることや、あるいは、あるシトシンのメチル化状態が、近接したシトシンのメチル化状態に影響を与えずして変化することも観察されるようになりました。したがって、DNA-タンパク質相互作用の解析などと組み合わせて、DNAメチル化部位を一塩基解像度でゲノムワイドに決定することは、生物の複雑なプロセスを解明する上で重要な解析のひとつです。

 

メチル化シトシンの検出手法

DNAメチル化をゲノムワイドに検出する手法は数多く知られています。初期の頃によく使われていたものには、メチル化感受性制限酵素処理とアレイを組み合わせた手法や、5-メチルシトシンを認識する抗体を用いた免疫沈降(MeDIP; methylated DNA immunoprecipitation)とアレイを組み合わせた手法などがありました。しかし、制限酵素を用いた手法では解析できるゲノム領域の数が強い制約を受けますし、またアレイを用いた手法も解像度の低さなどいくつかの制限を受けます。MeDIPとシーケンシングを組み合わせたMeDIP-seqも開発されましたが抗体を用いることから、例えばCpGリッチな領域にバイアスがかかりやすいといったような欠点がありました。

DNAメチル化の高分解能検出におけるブレークスルーは、「バイサルファイト(BS)変換」の開発でした。DNAを変性させた状態でバイサルファイト(亜硫酸水素塩)処理すると、非メチル化シトシンのみがスルホン化・脱アミノ化・脱スルホン化を経てウラシルに変換されます。一方、メチル化シトシンはウラシルには変換されずにシトシンのままです。バイサルファイト処理したDNAを鋳型として相補鎖を合成し、シーケンスを行うと、シトシンの位置がチミンになっていれば元は非メチル化シトシンであった、シトシンのままであれば元はメチル化シトシンであったと決定できます。

この手法は、当初、注目するゲノム領域をPCRで増幅してクローニングし、サンガーシーケンスを行うことで、局所的にメチル化状態を決定することに利用されました。しかし、解析対象をゲノムワイドに広げるためには、ハイスループットシーケンス技術と組み合わせることが必要です。

 

次世代シーケンサーを用いたメチル化シトシンのゲノムワイド解析

次世代シーケンサーの開発により、DNAメチル化解析にパラダイムシフトが起きました。2008年、シロイヌナズナを対象として、一塩基解像度でゲノムワイドにDNAメチル化状態を決定する世界で初めての手法が2つの論文で報告されました。

いずれもバイサルファイト変換を用いており、使用している次世代シーケンサーも同じですが、ライブラリを調製する方法に違いがあります。

BS-seq

CokusらはBS-seqと名付けた方法で解析を行いました。

この方法では、まずゲノムDNAを断片化してアダプターをライゲーションします。このアダプターは、ライゲーション部位近くにDpnIという制限酵素の認識配列があり、さらにこのDpnI認識配列中にメチル化アデニンを含むものです。バイサルファイト変換後、先ほどライゲーションしたアダプター部分をプライマーとして、DNA断片をPCRで増幅します。次に、DpnIで処理し、このアダプターを除きます。最後に、シーケンシング用のアダプターをライゲーションし、このアダプター部分をプライマーとしてPCRで増幅することで、ライブラリを調製します。

MethylC-seq

ListerらはMethylC-seqと名付けた方法で解析を行いました。

この方法では、断片化したゲノムDNAに、全てのシトシンがメチル化されたシーケンシング用アダプターをライゲーションします。ここでバイサルファイト変換を行うのですが、アダプター内のシトシンは全てメチル化されているので、アダプターの配列はバイサルファイト変換後も変わりません。アダプター部分をプライマーとしてPCRで増幅すれば、すぐにライブラリが用意できます。

現在ではこちらのプロトコルがより標準的な手法です。

 

以上のような全ゲノムバイサルファイトシーケンシング(WGBS)は非常に有力なツールですが、ヒトなどの大きなゲノムを持つ生物に適用するには膨大なリード数が必要になります。これに対処するため、MeissnerらはRRBSと呼ばれる手法を報告しました。

RRBS(Reduced representation BS sequencing)

この方法では、まずゲノムDNAをMspIという制限酵素で処理します。MspIはCCGGを認識し、CとCGGの間(つまりCpGのすぐ上流)でDNAを切断します。制限酵素処理したDNAを電気泳動で分離し、特定のサイズのDNAを切り出します。サイズセレクションされたDNAの末端を平滑化し、シーケンシング用アダプター(上記のMethylC-seqと同様のもの)をライゲーションします。この後、MethylC-seqと同様に、バイサルファイト変換、PCR増幅を経てライブラリを調製します。

ポイントは、MspI処理をすることによって、ライブラリ中にCpG部位が濃縮している点です。この報告では、40-220 bpのDNA断片をセレクションすることで、マウスゲノムの全CpGサイトの5%を少ないリード数で効率よく解析することができました。

 

まとめ

シーケンス技術の発展によりDNAメチル化部位のグローバルな検出(メチローム解析)が可能になりました。いくつかの手法がありますが、それぞれの長所と短所を考慮し、目的に見合った解析手法の選択が重要です。

 

参考論文

Genome Res. 2009. 19: 959-966

Nature. 2008. 452: 215-219

Cell. 2008. 133: 523-536

Nucleic Acids Res. 2005. 33: 5868–5877

Nature. 2008. 454:766-770



— Decoding Life, Creating Future —

エピゲノムで生き物のあたり前を超えていく

Rhelixaは自社のコアコンピタンスであるエピゲノム解析技術を応用し、ソフトウェア開発、検査技術の開発、お客様各々の目的に応じた研究開発のサポートを行っています。

効率的かつ効果的なエピゲノム解析を実現する上で、網羅的な大規模遺伝情報の取得が必要です。その際、最先端のゲノム配列決定装置である次世代シーケンサーが欠かせません。Rhelixaでは次世代シーケンサーを備えた専門のラボと、それを利用するためのノウハウを持った人材が揃っているだけでなく、解析を高速・高精度化する独自ソフトウェアを用いて、得られたデータを専門技術陣が解析いたします。