はじめに
次世代シーケンス技術(Next Generation Sequencing: NGS)は、遺伝子解析の分野に革新的な変化をもたらしました。NGSの開発により、遺伝子配列解析がより迅速かつ低コストで行えるようになり、多くの新たな研究領域が開拓されています。そして、これらの技術の発展に伴い、膨大な量のデータが生成されるため、バイオインフォマティクスの重要性がますます高まっています。この記事では、次世代シーケンス技術の進化とバイオインフォマティクスの役割について解説します。
次世代シーケンス技術の進化
第一世代シーケンス技術
遺伝子解析の歴史は、1970年代にさかのぼります。現在でも利用されているサンガーシーケンス法とは、dNTPとddNTP、そしてDNA鎖の伸長反応を利用した方法です。サンガーシーケンス法では、ddNTPを取り込み伸長が停止した異なるサイズのDNA断片を電気泳動で分離し配列を決定します。シーケンスできる長さに限度がある為、長い塩基配列を決定する場合は分割する必要がありますが、ハンドリングが容易であり、そこまでコストがかからないといった利点があります。
第二世代シーケンス技術
第二世代シーケンス技術は、2000年代初めに登場した、PCR増幅と蛍光分子標識を利用し、光を検出する技術です。この技術では、膨大なシーケンス反応を同時並行して行うことで、サンガーシーケンス法よりもはるかに高速に遺伝子配列を決定することができるようになりました。
第三世代シーケンス技術、第四世代シーケンス技術
第三世代ないし第四世代シーケンス技術は、さらに進化したシーケンシング技術で、PCR増幅なしに1分子の検出が可能なことから、1分子シーケンスともいわれます。リアルタイムで長い塩基配列のシーケンシングが可能であり、ゲノムの複雑な領域や繰り返し配列の解析が容易になりました。塩基を蛍光色素や電流変化で間接的に検出する第三世代 (PacBio など)、そして塩基の分子情報を電流で直接的に検出する第4世代 (Oxford Nanopore など) が挙げられます。
今後もシーケンス技術は進化していく事が期待される中で、それぞれのシーケンス技術の長所と短所を把握し、自分にとっての適切な方法を選択する必要があるでしょう。
バイオインフォマティクスの重要性
データ解析の課題
次世代シーケンス技術によって生成される大量のデータは、新たな課題を生み出しています。大量のデータから有意な情報を得るためには、解析の前処理、配列を繋ぎ合わせて再構成するアセンブリやアノテーション、得られた情報を用いた群間比較解析など、様々な処理や解析手法が必要となります。バイオインフォマティクスは、これらを情報科学や統計学を踏まえて、シーケンスより得られた遺伝子データを適切に解釈して生物学的現象を解明するために不可欠な学問分野です。
ソフトウェアとツールの開発
バイオインフォマティクスの専門家であるバイオインフォマティシャンは、次世代シーケンスデータの解析に適したソフトウェアやツールを使いこなすことが求められます。これらのツールは、リファレンス配列に対するマッピング、変異検出、遺伝子発現解析、オミックスデータの統合解析など、様々な目的に使用されます。
オープンサイエンスとデータ共有
バイオインフォマティクスは、オープンサイエンスとデータ共有の推進にも貢献しています。公共データベースやデータリポジトリが整備され、研究者は自由に遺伝子データや解析ツールにアクセスできるようになっています。これにより、国際的な共同研究が促進され、新たな発見や知見が得られるようになりました。
ソフトウェアかツールか?
バイオインフォマティクスにおいては、専用のGUIソフトウェアを用いる方法と、プログラミング技術を必要とするツールを用いる方法があります。それぞれのメリットとデメリットを整理すると以下となります。
専用のGUIソフトウェア | プログラミング技術を必要とするツール | |
---|---|---|
メリット | 【使いやすさ】 GUIソフトウェアは直感的な操作が可能で、プログラミングスキルがなくても解析を実行できます。 【学習コストの低さ】 プログラミング言語を学ぶ必要がないため、専門知識がない人でも比較的短時間で使いこなせます。 【ビジュアル表現の容易さ】 GUIソフトウェアは、解析結果を視覚的に表示し、理解しやすくします。 | 【柔軟性】 プログラミングを使った解析では、自由にアルゴリズムやパラメータをカスタマイズでき、独自の解析方法を実装することができます。 【処理速度】 大量のデータや複雑な解析を効率的に処理できることが多いです。 【コミュニティサポート】 プログラミング言語やオープンソースのツールは、活発なコミュニティがサポートしていることが多く、質問や悩みに対する解決策が見つけやすい場合があります。 |
デメリット | 【柔軟性】 GUIソフトウェアは、提供される機能に限定され、独自の解析方法やアルゴリズムを実装することが難しい場合があります。 【処理速度】 大量のデータを扱う際に、GUIソフトウェアは処理速度が遅くなることがあります。 【アップデートやサポート】 最新のツールが組み込まれていなかったり、開発元がアップデートやサポートを終了すると、新しい機能やバグ修正が利用できなくなる場合があります。 | 【学習コストの高さ】 プログラミング言語やツールを使いこなすには、それらの知識やスキルが必要です。独学や研修が必要な場合もあります。 【エラーの特定や解決の難しさ】 プログラムがエラーを起こした際に、その原因を特定し、解決するためにはプログラミング知識が必要です。初心者にとっては難しい場合があります。 【継続的なメンテナンス】 プログラムを使った解析では、ソフトウェアのアップデートや変更に対応するために、継続的なメンテナンスが必要になることがあります。 |
どちらの方法が良いかは、自分のニーズやスキルに応じて選択することが重要です。GUIソフトウェアは使いやすさを重視し、プログラミング技術・ツールは柔軟性や効率性を求める場合に適していると言えるでしょう。
今後の展望
次世代シーケンス技術の進化に伴い、遺伝子解析がより高速かつ低コストで行えるようになりました。そして、これらの技術が生み出す大量のデータは、バイオインフォマティクスの重要性を高めています。
さらに、バイオインフォマティクスは、個別化医療でも重要な役割を果たしています。ゲノム情報を利用して、患者に最適な治療法や予防策を提案するためには、遺伝子データの適切な解析や解釈が欠かせません。医療分野だけでなく、環境や農業分野にもバイオインフォマティクスは応用されており、環境汚染や気候変動の影響を調査するためのメタゲノム解析、作物の品種改良や病害虫の制御に関する研究など、様々な分野で必要とされています。
今後もバイオインフォマティシャンは、新たな技術や手法の開発に取り組み、遺伝子データをより効果的に活用することで、社会の発展に貢献していくことでしょう。
レリクサのサービスなら
丁寧なビフォアサポート・アフターサポート
15名以上の博士研究者が在籍。高い専門性と丁寧なサービスで、最後までご満足いただけるサービスを提供します。
リーズナブルで高品質なシーケンス
競争力のある複数の国内外シーケンスプロバイダーと提携し、低価格・高品質なデータ取得を実現しています。データ解析をご自身で実施するお客様からも選ばれています。
カスタム実験・オーダーメイド解析・統合解析にも対応
ご研究目的やご要望の図版、参考文献等に応じて、標準サービスメニュー外のカスタム実験・カスタム解析・マルチオミクス解析・統合解析も承ります。
参考文献
Metzker ML. Sequencing technologies – the next generation. Nat Rev Genet. 2010 Jan;11(1):31-46.
Rhoads A, Au KF. PacBio Sequencing and Its Applications. Genomics Proteomics Bioinformatics. 2015 Oct-Dec;13(5):278-89.
Goodwin S, McPherson JD, McCombie WR. Coming of age: ten years of next-generation sequencing technologies. Nat Rev Genet. 2016 Jun;17(6):333-51.
Pabinger S, Dander A, Fischer M, Snajder R, Sperk M, Efremova M, Krabichler B, Speicher MR, Zschocke J, Trajanoski Z. A survey of tools for variant analysis of next-generation genome sequencing data. Brief Bioinform. 2014 Mar;15(2):256-78.
Wilkinson MD, Dumontier M, Aalbersberg IJ, Appleton G, Axton M, Baak A, Blomberg N, Boiten JW, da Silva Santos LB, Bourne PE, et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data. 2016 Mar 15;3:160018.
株式会社Rhelixa(レリクサ)について
当社は最先端のゲノム・エピゲノム解析で培ってきた技術を活用して、生物学・医学・薬学領域における基礎研究や製品・ソリューションの開発、またはそれらの受託業務を行っています。次世代シーケンサーにより得られるエピゲノムデータの他、ゲノムやトランスクリプトーム、メタゲノムデータを組み合わせた統合的なデータ解析により、細胞制御の詳細なメカニズムの予測や精度の高いマーカーの探索を行います。また、研究開発のあらゆる場面で必要となるデータの統計解析や図版作成を基礎知識を必要とせず誰もが手元で実現できる環境を提供しています。