NGS変異解析に日本人多型(SNP)アノテーション情報を追加しよう!

▼こんな方におすすめです!
・Ion Torrent™ 次世代シーケンサでヒトの遺伝子変異解析を実施している、もしくは実施したい
・Ion Reporter™ ソフトウエアを使用してデータ解析を実施している
・Ion Reporter ソフトウエアの解析をカスタムしたい

Ion Reporter ソフトウエアとは?

Ion Reporter ソフトウエアは、当社が提供するクラウドベースの次世代シーケンサ(NGS) データ解析用ソフトウエアです。Ion Reporter ソフトウエアはヒト遺伝子変異解析の機能が充実しており、ゲノム上の変異や融合遺伝子を検出するだけでなく、検出した変異に対してさまざまなアノテーション情報を付加したり、そのアノテーション情報を基にしたフィルタリング機能などを利用することが可能です。Webブラウザの操作のみでデータ解析が実行でき、特別なバイオインフォマティクスの知識を持たなくても、興味のある変異を少ない操作ステップで絞り込むことができます。また、ヒトの変異解析以外にも、免疫レパートリー解析や16S rRNA シーケンス(細菌叢)解析のための機能が備わっています。解析方法は、「Ion Reporter 基本操作方法」資料をご覧ください。

初期設定で備わっているアノテーション情報

Ion Reporter ソフトウエアには、例えば以下のような変異や多型データベースから取得されたアノテーション情報が搭載されており、検出した変異の評価に役立ちます。
COSMIC
ClinVar
dbSNP
1000 Genomes
NHLBI ESP
ExAC
gnomAD

代表的な日本人多型(SNP、INDEL)データベース

Ion Reporter ソフトウエアには先述のようにさまざまなアノテーションが搭載されていますが、日本人を含む、特定の人種のみに多く見られる多型情報までは網羅されていないことがあります。以下に一般に公開されている代表的な日本人多型データベースをご紹介します。これらのデータベースの情報を利用できれば、日本人のゲノム解析において病的変異の絞り込みの精度や作業効率を上げることができると考えられます。

【代表的な日本人多型データベース】
Human Genetic Variation Database(HGVD)
京都大学が主導して作成された多型データベース。日本人健常者のエクソーム解析結果1,000例以上とコホート研究結果3,000例以上のデータを基にしている。

Japanese Multi Omics Reference Panel(jMorp)
東北メディカル・メガバンク機構(ToMMo™)が管理しているデータベース。日本人健常者約14,000例(2022年1月時点)の全ゲノム解析結果を基にしている。

カスタムアノテーションの追加

Ion Reporter ソフトウエアには外部データをアノテーション情報として登録できる機能が備わっており、日本人多型を含めた外部データベースの情報を変異解析に組み込むことができます。外部データベースの情報は一般的にテキストファイルとしてダウンロードすることができるので、多くの場合Ion Reporter ソフトウエアでの利用が可能です。アノテーション情報は、VCF(Variant Call Format)というNGSのデータ解析で一般的に使用される形式で登録します。もし登録したいデータがVCFとなっていない場合は、テキストエディターなどを使用してファイルを加工します。

【VCFファイルの例(Excel™で開いたところ)】

(上記データは特定のデータベースから取得されたものではありません。)

【解析結果の例】

近年はデータベース上の情報が膨大になり、ダウンロード可能な多型データのファイルサイズが数ギガバイトに達してしまうこともあります。このようなファイルをIon Reporter ソフトウエアに登録しようとしても、ネットワーク環境やソフトウエアの制限により登録ができない場合があります。そのような時には、例えば下記のようにbedtoolsなどのツールを用いて解析対象の遺伝子パネルのターゲット領域に含まれる多型情報のみを抽出し、登録するVCFファイルのサイズを小さくすることが有効です。ただし、操作にはLinux™ OSを搭載したコンピューターが必要となります。

bedtools intersect -a JapaneseSNPs_whole_genome.vcf -b AmpliSeq_designed.bed -wb
(VCFファイルとBEDファイルの名称は例)

まとめ

Ion Reporter ソフトウエアでは、さまざまなアノテーション情報を追加してヒトの変異解析の精度を上げることが可能です。カスタムアノテーションの追加について、ご不明な点がございましたら当社テクニカルサポートまでお問い合わせください。
また、次世代シーケンス(NGS)データ解析コンサルティングサービスでは、カスタムアノテーションの作成から解析結果の評価まで、当社のバイオインフォマティシャンがお客さまをトータルでサポート致します。サービスの内容についてご興味がありましたら、当社テクニカルサポートまでお問い合わせください。

次世代シーケンサ(NGS)入門

次世代シーケンスの原理や何ができるかよくわからない、または自分の研究領域にどのように活用できるかわからないという方向けに、次世代シーケンスの基本や各研究領域に特化したアプリケーションをまとめました。リンク先から、それぞれの領域に応じたページをご覧いただけます。

詳細を見る

次世代シーケンス データ解析オンライン個別相談

IonTorrentユーザでデータ解析に関する具体的な課題をお持ちの方には、無料の個別相談の時間を開設しています。

詳細を見る

 

研究用にのみ使用できます。診断用には使用いただけません。

ToMMo is a trademark of Tohoku University.
Excel is a trademark of Microsoft Corporation.
Linux is a trademark of Linus Torvalds.

記事へのご意見・ご感想お待ちしています

  • サーモフィッシャーサイエンティフィックジャパングループ各社は取得した個人情報を弊社の個人情報保護方針に従い利用し、安全かつ適切に管理します。取得した個人情報は、グループ各社が実施するセミナーに関するご連絡、および製品/サービス情報等のご案内のために利用させていただき、その他の目的では利用しません。詳細は個人情報の取扱いについてをご確認ください。
  • 送信の際には、このページに記載のすべての注意事項に同意いただいたものとみなされます。