エピゲノム解析の概要

エピゲノムとは?

ゲノムの塩基配列に変化を起こさずに遺伝子発現を制御し、体細胞分裂後も引き継がれる後天的な仕組みを「エピゲノム」といいます。その代表的なものとして、シトシン塩基に起こるDNAメチル化や、ヌクレオソームを構築するヒストンのN末端に起こるヒストン修飾、クロマチン構造の変化による制御などが挙げられます。

発生や分化の段階で重要な役割を果たすエピゲノムは、様々な疾患の発症や悪性化にも寄与していることがわかってきました。当初はある遺伝子(あるいはゲノム領域)に絞った解析に限られていましたが、次世代シーケンサーの開発により全ゲノム領域に渡る網羅的解析が可能となりました。現在では、組織や細胞株、さらには単一細胞からエピゲノム情報を収集することが可能となっています。

代表的なエピゲノム修飾

  • DNAメチル化

    DNAメチル化は、DNAメチル基転移酵素(DNMT)がシトシン(C)5位にメチル基を付加してメチル化シトシン(5mC)に変換する反応です。ゲノム中のどのCにもメチル化が起きるわけではなく、CpG配列のCで特異的に見られます。CpG配列が密集して出現するゲノム領域は“CpGアイランド”と呼ばれ、ヒトでは遺伝子プロモーターの約70%にCpGアイランドがあります1)
    DNAメチル化が遺伝子プロモーターに起こると、転写因子の結合阻害やクロマチン構造の変化を介して、遺伝子発現は抑制されます。

  • ヒストン修飾

    ヒストンは、H2A、H2B、H3、H4からなる4種類のコアヒストンが、それぞれ2分子ずつ集まった8量体です。その周囲に約147bpの周期をもってDNAが巻きつき、ヌクレオソームを形成します。さらに、リンカーヒストン(H1)とリンカーDNAを介してヌクレオソームが多数つながり、クロマチンを構築しています。
    ヒストンタンパク質のN末端は、ヒストン8量体のコア構造から飛び出したようになっており、ヒストンテイルと呼ばれます。ヒストンテイルの特定のアミノ酸残基に、メチル化あるいはアセチル化をはじめとするさまざまな修飾が加わることで、転写因子の結合性やクロマチン構造に変化が起こり、遺伝子発現が制御されます。

DNAメチル化の解析手法

抗体を用いる方法

  • MeDIP-seq / MBD-seq

    5-メチル化シトシン(5mC)に対する抗体あるいはメチル化DNA結合ドメインタンパク質に対する抗体を用いてメチル化シトシンを免疫沈降する方法です。免疫沈降産物は、Real-time PCRやゲノムタイリングアレイ、次世代シーケンサーを用いた解析に用いられます。次世代シーケンサーを用いた場合、前者の解析をMeDIP (Methylated DNA Immunoprecipitation)-seq、後者の解析をMBD (methyl-CpG-binding domain)-seqと呼びます2)。これらはゲノムワイドなメチル化解析が可能である一方で、繰り返し配列やCpG配列が多い領域に濃縮バイアスがかかりやすいという欠点があります3)

バイサルファイト変換を用いる方法

DNAをバイサルファイト(亜硫酸水素塩)で処理すると、非メチル化シトシン(C)はウラシル(U)に変換されます。一方、メチル化シトシン(5mC)は変換されず、シトシン(C)のままです4)。そのため、バイサルファイト処理後のDNAを鋳型としてDNA鎖を合成すると、5mCはCのままである一方、CはTに変換されます。したがって、バイサルファイト処理前後の塩基配列を比較することで、シトシンのメチル化の有無を解析することができます。

  • MSP (Methylation-specific PCR):

    バイサルファイト処理を用いたDNAメチル化解析の最も簡便な方法です5)。解析対象となるCpG部位を含むようにプライマーを設計してPCRを行います。その際、対象のCpGがメチル化されていた場合に対応する配列のプライマー(Mプライマー、つまり目的の部分がCのプライマー)と、非メチル化の場合に対応するプライマー(Uプライマー、つまり目的の部分がTのプライマー)を用います。こうすることで、PCRによる増幅の有無でメチル化状態を決定したり、あるいはReal-time PCRよりメチル化状態の半定量的な測定を行うことが可能です。

  • バイサルファイトシークエンス

    バイサルファイト変換をしたDNA断片の配列をシーケンシングすることにより、メチル化状態を決定する方法です。ゲノムDNAをバイサルファイト処理し、解析対象となる領域をPCRで増幅します。これをプラスミドにクローニングし、シークエンスを行うことで、解析対象領域に含まれるCpG部位すべてのメチル化状態が決定できます。

    さらに、次世代シーケンサーの開発に伴い、全ゲノム領域のメチル化状態を網羅的に解析する全ゲノムバイサルファイトシークエンス(WGBS; Whole-genome bisulfite sequence)も可能になりました6), 7)

  • PBAT (Post-bisulfite adaptor tagging):

    WGBSにおけるサンプル必要量やライブラリ調製時のPCR増幅サイクル数を減らすことを目的に確立された方法です8)
    バイサルファイト処理はDNAにダメージを与えます。シーケンシング用アダプター付加後にバイサルファイト変換を行う従来法では、バイサルファイト処理によってアダプターが切断されてしまうことがあります。こうしたDNA断片はシーケンシングできないので、無駄になってしまいます。そのため、有効なDNA断片を十分に得るためには、多くのDNA(5 μg程度)とPCRによる増幅が必要でした。

    PBATでは、バイサルファイト処理を先に行い、その後2回のランダムプライマー伸長反応によりアダプターを付加します。こうすることで、必要なDNA量はpgオーダーにまで抑えられ、また、さらに多くのDNAを用いればPCRによる増幅がなくてもシーケンスが可能となりました。この方法はシングルセル解析にも応用されています9)

  • RRBS (Reduced representation bisulfite sequencing):

    最初に解析対象となるDNA断片を得る段階で、CpG配列を含む断片が多く得られるように工夫した方法です10)。まず、ゲノムDNAを、CCGGを認識・切断する制限酵素であるMspIで切断します。次に、一定の長さのDNA断片を精製(サイズセレクション)することにより、CpG配列を持つDNAを濃縮します。解析できるゲノム領域を選ぶことはできず、またCpG-richな領域にバイアスがかかりやすいなどの制限がありますが、多くのCpG領域を網羅的に解析することが可能です。

    RRBSを使ったメチル化解析は、シングルセルレベルでの適用11)や、組織のレーザーキャプチャーマイクロダイセクションと組み合わせた手法12) も報告されています。

  • Illumina Infinium® Methylation Assay:

    広域なゲノム領域のメチル化状態を短時間かつ多サンプルで解析を行うことができるのが、ビーズアレイを用いたIllumina社のInfinium® Methylation Assayです。

    Infinium® HumanMethylation450K BeadChipが最新のものとして流通しています。バイサルファイト処理後のゲノムDNAに対して、”C”と”T”を判別できるアレイプラットフォームを利用してメチル化率を測定します。ある解析対象領域に対して、メチル化プローブおよび非メチル化プローブの双方で別個に解析してメチル化率を算定するInfinium I Assayと、ひとつのプローブでメチル化・非メチル化の比率を算定できるInfinium II Assayのシステムを組み合わせることにより、45万以上ものCpG部位が解析対象になっています。この中には、DNAメチル化と遺伝子発現の相関がよく知られているプロモーター領域だけでなく、5´-UTR、遺伝子本体、3´-UTR、遺伝子間領域にもプローブが設計されています。これにより、HumanMethylation450K BeadChipの解析対象は全ゲノム領域のCpGアイランドの96%をカバーしていると言われています。

    DNAメチル化の度合いとしてよく使われるものに、解析対象の部位がサンプル全体のうちどの程度の比率でメチル化されているかを示すβ value(完全にメチル化されている場合は1、非メチル化されている場合は0)があります。Infiniumは、蛍光強度のシグナル比率からβ valueを算出します。500 ngという少ない量のゲノムDNAで解析ができる点、多数のサンプルのメチル化プロファイルをゲノムワイドに高解像度で見られる点で優れています13)

  • パイロシークエンス法

    網羅的なDNAメチル化解析の結果は、定量的メチル化解析でvalidationを行うことが推奨されます。一般的にはMALDI-TOFMSやパイロシークエンスを用いた方法が用いられます14)。ここではパイロシークエンス法を紹介します。
    パイロシークエンス法は、ルシフェラーゼによる発光反応を利用して塩基配列を読み取る方法です15)。DNAポリメラーゼによってヌクレオチドがDNAに取り込まれると、取り込まれたヌクレオチドの数に比例してピロリン酸が遊離します。ピロリン酸はATPに変換され、ルシフェラーゼの発光反応に用いられます。パイロシークエンサーを用いることで、発光がピーク(パイログラム)として検出されます(ピークの高さは取り込まれたヌクレオチドの数に比例します)。このパイログラムを解析することにより、塩基配列を解読することができます。

    バイサルファイト処理後のゲノムDNAをPCRで増幅しシーケンシングプライマーをハイブリダイズさせてパイロシーケンスを行うことにより、DNAメチル化を定量的に解析することができます。解析長は約数十bpと短く、また特殊なシークエンサーが必要というデメリットもありますが、DNAメチル化を再現性良くハイスループットに解析することができます16)。QIAGEN社のPyromark™システムが有名です。

  • 臨床検体での解析例

    臨床検体を用いたがん研究において、メチル化解析から知見を得ることができます。

    例えば、臨床腫瘍検体から得られたメチル化解析データに対して階層的クラスタリングを行うことにより、症例がいくつかのサブタイプに分類されることがあります。大腸癌や神経膠種などでは、広範な遺伝子のプロモーター領域でCpGアイランドがメチル化されていることに特徴づけられるCpGアイランドメチル化形質 (CpG island methylator phenotype: CIMP)というサブタイプがあることが認識されています。CIMPというサブタイプの形成に関わる責任因子を同定することは、新しい治療標的の発見につながる可能性が示されています17), 18), 19)

    その他の例として、大腸癌20)、胃癌16), 21)、甲状腺癌22)の臨床検体についてメチル化解析した報告があります。これらの文献では、MeDIP-chipやInfinium Methylation Assayを用いたゲノムワイド解析と、パイロシークエンス法やMALDI-TOFMSを用いた定量的手法を組み合わせて結果が報告されています。興味深いことに、胃癌には従来から同定されていた高メチル化胃癌と低メチル化胃癌があることに加えて、EBウイルス陽性胃癌ではゲノム全体に著しいメチル化が見られる(超高メチル化胃癌)ことが明らかになっています16)

    また、血漿中の遊離DNAを回収して、特定の遺伝子のプロモーター領域のメチル化レベルを測定し、高感度かつ高特異度で大腸癌を早期診断できる方法が提案されています23)

ヒストン修飾とオープンクロマチンの解析手法

ヒストン修飾の解析

ヒストン修飾には多様な種類があります。代表的なものでは、プロモーター領域に見られるH3K4me3(ヒストン3の4番目のリシンのトリメチル化)、エンハンサー領域に見られるH3K4me1(ヒストン3の4番目のリシンのモノメチル化)、活性化したゲノム領域に見られるH3K27Ac(ヒストン3の27番目のリシンのアセチル化)があります24)

  • クロマチン免疫沈降 (Chromatin immunoprecipitation: ChIP)

    抗体を用いて目的タンパク質のゲノム上での局在を検出する方法です。サンプルをホルムアルデヒドで固定することにより、目的タンパク質(転写因子やヒストン)とDNAの間に架橋構造を形成します。その後、クロマチンDNAを超音波破砕や酵素消化により断片化し、ヒストン修飾や目的タンパク質に対する抗体を用いて免疫沈降(クロマチン免疫沈降)を行います。免疫沈降産物のDNAとタンパク質を脱架橋し、DNAを精製します。得られたDNAをReal-time PCRやゲノムタイリングアレイ、あるいは次世代シーケンサーで解析することにより、目的タンパク質のゲノム上での局在を調べることができます25)。特に次世代シーケンサーを用いて目的タンパク質の局在をゲノムワイドに解析する手法はChIP-seqと呼ばれ、ヒストン修飾の網羅的解析に多用されます。

    ChIP-seqを行うために必要な細胞数は一般的には107個程度とされていますが、少ない細胞数からでも行えるように改良が重ねられており、103 個の細胞でもヒストン修飾の解析ができるNano-ChIP-seqという手法も開発されています26)。このNano-ChIP-seqを用いることにより、5 mg程度の胃癌凍結組織検体からでもヒストン修飾および転写因子の解析ができることが2013年に報告されました27)

オープンクロマチン領域の解析

転写が活性化されている遺伝子は、そのプロモーター領域・エンハンサー領域のクロマチンがオープンな状態となっており、転写因子などが近づきやすい状態になっています。反対に、転写が抑制されている遺伝子領域はクローズドな状態になっています。
オープンクロマチン領域の解析にはFAIRE-seq28)、DNase-seq29)、あるいはATAC-seq30)が用いられます。オープンクロマチン領域をゲノムワイドに解析できることに加え、得られたピーク領域に出現する塩基配列のモチーフ解析を組み合わせることで、その領域に結合するタンパク質を予測することができます31)

  • FAIRE(Formaldehyde-Assisted Isolation of Regulatory Elements)-seq:

    まず、DNAとヌクレオソームの間に架橋構造を形成し、クロマチンDNAを断片化します。その後、抗体を用いた免疫沈降を行う代わりに、フェノール・クロロホルム抽出を行います。フェノール・クロロホルム抽出は、サンプル中からタンパク質を取り除き、DNAを精製する手法です。ヌクレオソームが結合したDNA(クローズドな領域のDNA)は取り除かれ、ヌクレオソームが結合していないフリーなDNA(オープンな領域のDNA)のみが精製されるので、精製されたDNAを次世代シーケンサーで解析することによりオープンクロマチン領域を網羅的に特定することができます。

  • DNase-seq / ATAC(Assay for transposase-accessible chromatin)-seq:

    DNase-seqでは、ChIP-seqやFAIRE-seqで行ったクロマチンDNAの断片化の代わりに、DNase IというDNA切断酵素用いてクロマチンDNAを切断します。DNase Iはオープンなゲノム領域のDNAにのみ近づくことができるので、最終的にオープンクロマチン領域のゲノムDNAのみが得られます。これを次世代シーケンサーで解析することで、オープンクロマチン領域を特定します。

    ATAC-seqでは、DNAアダプターを組み込んだ活性型Tn5トランスポゼースを用いてDNAの切断とシーケンシング用アダプターの付加(タグメンテーション)を同時に行います。この反応はオープンなゲノム領域でのみ起こるので、反応後に得られたDNAを次世代シーケンサーで解析することで、オープンクロマチン領域を特定できます。次世代シーケンサー解析に必要なアダプターがゲノムDNAの切断と同時に付加されるので、煩雑な前処理も必要ありません。短時間かつ簡便に解析でき、またFAIRE-seqやDNase-seqの1/100量の細胞数でデータを得ることができます。

    DNase-seqとATAC-seqでは、タンパク質と結合している部分のゲノムDNAを切り出すことができません。したがって、オープンクロマチン領域内においても、タンパク質と結合している部分はピークが抜けたように見えます。このようなタンパク質の“フットプリント”を見つけることによって、タンパク質の結合領域を特定する解析を“フットプリント解析”と呼びます。任意の細胞において重要な役割を果たす転写制御因子の予測と、より正確な結合位置の予測が可能です32), 33)

参考論文

  1. Deaton, A. M.andBird, A.: Genes & development25: 1010-1022, 2011.
  2. Down, T. A. et al.: Nature biotechnology26: 779-785, 2008.
  3. Laird, P. W.: Nature reviews. Genetics11: 191-203, 2010.
  4. Frommer, M. et al.: Proc Natl Acad Sci U S A.89: 1827-1831, 1992.
  5. Herman, J. G. et al.:  NatlAcad. Sci. USA93: 9821–9826, 1996.
  6. Cokus, S. J. et al.: Nature452: 215-219, 2008.
  7. Lister, R. et al., Cell, 133: 523-536, 2008.
  8. Miura, F. et al.: Nucleic acids research40: e136, 2012.
  9. Smallwood, S. A. et al.: Nature methods11: 817-820, 2014.
  10. Gu, H. et al.: Nature protocols6: 468-481, 2011.
  11. Guo, H. et al.: Nature protocols10: 645-659, 2015.
  12. Schillebeeckx, M. et al.: Nucleic acids research41: e116, 2013.
  13. Dedeurwaerder, S. et al.: Epigenomics3: 771-784, 2011.
  14. Michels, K. B. et al.: Nature methods10: 949-955, 2013.
  15. Colella, S. et al.: BioTechniques35: 146-150, 2003.
  16. Matsusaka, K. et al.: Cancer research71: 7187-7197, 2011.
  17. Toyota, M. et al.: Proc Natl Acad Sci U S A., 96: 8681-8686, 1999.
  18. Hughes, L. A. et al.: Cancer research73: 5858-5868, 2013.
  19. Noushmehr, H. et al.: Cancer cell17: 510-522, 2010.
  20. Yagi, K. et al.: Clinical cancer research16: 21-33, 2010.
  21. Kaneda, A. et al.: Cancer research62: 6645-6650, 2002.
  22. Kikuchi, Y. et al.: Frontiers in genetics4: 271, 2013.
  23. Takane, K. et al.: Cancer Med3: 1235-1245, 2014.
  24. Kimura, H.: Journal of human genetics58: 439-445, 2013.
  25. Landt, S. G. et al.: Genome research22: 1813-1831, 2012.
  26. Adli, M. and Bernstein, B. E.: Nature protocols6: 1656-1668, 2011.
  27. Muratani, M. et al.: Nature communications5: 4361, 2014.
  28. Simon, J. M. et al.: Nature protocols7: 256-267, 2012.
  29. Song, L. and Crawford, G. E.: Cold Spring Harbor protocols2010: pdb prot5384, 2010.
  30. Buenrostro, J. D. et al.: Nature methods10: 1213-1218, 2013.
  31. Waki, H. et al.: PLoS genetics7: e1002311, 2011.
  32. Neph, S. et al.: Nature489: 83-90, 2012.
  33. Davie, K. et al.: PLoS genetics11: e1004994, 2015.


— Decoding Life, Creating Future —

エピゲノムで生き物のあたり前を超えていく

Rhelixaはコアコンピタンスであるエピゲノム解析技術を応用し、ソフトウェアや検査技術の開発、それぞれの目的に応じた研究開発のサポートを行っています。

効率的かつ効果的なエピゲノム解析を実現する上で、網羅的な大規模遺伝情報の取得が必要になります。その際、最先端のゲノム配列決定装置である次世代シーケンサーが欠かせません。Rhelixaでは次世代シーケンサーを使用するための専門のラボ、人材、ノウハウが揃っており、更にそれより得られたデータを解析するためのソフトウェア、人材、ノウハウが揃っています。