次世代シーケンシング技術の発展に伴い、多岐にわたる手法が確立されてきました。目的に応じてゲノム解析の手法を正しく選択することで、簡便かつ効率的に解析が行えるだけでなく、最低限の時間とコストで実施することが可能になります。ある生物種の全ゲノム配列をシーケンスし、ゲノム情報に関する知見を充実させるプロジェクト、疾患に関連する領域に絞り、迅速に精密なデータを入手するターゲットリシーケンス、それぞれでワークフロー全体の考え方は完全に異なっています。
▼こんな方におすすめです!
・自分の目的に合った次世代シーケンサの活用方法を模索している方
・次世代シーケンサの出力する膨大なデータの解析が不安な方
Ion Torrent™ 次世代シーケンサに適した二つのゲノム解析手法
次世代シーケンサ(NGS) を用いることで、研究者は膨大なデータを取得することができます。大型のハイスループットタイプの機種では、ヒトのようなゲノムサイズの大きな生物種でも十分解析に足る大量のゲノムシーケンスデータを得ることができるため、多検体をまとめてシーケンスすることで1検体当たりのコストを比較的安価に抑えた検討が可能ですが、シーケンス全体ではかなり高額なランニングコストが発生します。そして、ヒトの全ゲノムシーケンスでは多数の変異が検出されることが普通ですので、全ゲノム配列情報を取得することが簡単にできるようになったとはいえ、その解析をするためには依然として大規模な計算環境を構築する必要があります。
マウスやヒトのゲノムサイズはおよそ33億塩基対です。実際に解析を行うには、その20~30倍のデータ量が必要といわれています。バイオインフォマティクスの専門家でなければ、この中から真に重要な変異を見出すことが困難なことは想像に難くありません。一方、もっと小さいゲノムサイズを持つ生物種の代表、例えば大腸菌の場合、ゲノムサイズは460万塩基対とヒトの数百分の一になります。この大きさであれば、近年身近になったデスクトップ型のNGSでも充分対応可能な、はるかに少ない初期投資、少ないデータ量でも迅速にゲノムシーケンスを実施できます。つまり、ウイルスやバクテリアの全ゲノム解析では、それほど大きな負担を強いられることなく全ゲノムリシーケンスを実施することが現実的になってくるわけです。
では、ヒトをはじめとした高等生物では変異解析は現実的ではないのでしょうか。これに対するハードルを一気に引き下げたのがターゲットリシーケンスという考え方になります。ターゲットリシーケンスでは主にPCR技術を応用し、特定の領域のみに対するライブラリを構築しシーケンスします。その結果、研究者は個々の遺伝子やゲノム上のターゲット領域に集中して研究することが可能となりました。多くの全ゲノム解析により情報が蓄積され、gnomADやGEM Japan Whole Genome Aggregation (GEM-J WGA) などのゲノム情報を集約したさまざまなデータベースが構築されていますので、ターゲットを絞ったNGSのアプローチに十分な情報を与えることが可能です。注力すべき領域に集中することで、計算処理やバイオインフォマティクスに要するコストに対して大きなメリットが得られます。
このように、ゲノムサイズを意識しつつ特定の関心のある領域にも焦点を当てることで、研究者はデータ量とサンプル処理性、スピード、そしてコストのバランスを取ることができるようになりました。次の動画では、Ion Torrent™ システムにおける全ゲノムリシーケンスとターゲットリシーケンスの違いや特長についてご紹介しております。ぜひご視聴ください。
まとめ
・高等生物以外の生物種では全ゲノムシーケンスは解析難易度、コスト的にも現実的で、迅速な疫学調査や分子レベルの病態解明を可能にします。
・疾患関連遺伝子にターゲットを絞ったリシーケンスは、多検体処理を可能にし、大幅なコスト削減を実現するだけでなく、解析の労力を軽減します。
・大規模なゲノム情報を集約したデータベースを活用することで効率的な解析を可能にします。
次世代シーケンサ入門
Ion Torrent次世代シーケンサをより詳しく知りたい方は、以下のURLもご参照ください。
研究用にのみ使用できます。診断用には使用いただけません。