Ion Torrent™のシーケンサーには、Torrent Suiteという解析ソフトウェアが付属しており、リファレンスにマッピングしての変異解析や、ヒトやマウスの発現解析、微生物のde novo解析等が可能です。メタゲノム解析についても、当社のクラウドサービス、Ion Reporterにて実施可能ですが、Qiime(チャイム)やQiime2、Mothur(マザー)等のオープンソースのツールを使いたいというお問い合わせを頂くことがあります。
今回は、Torrent ServerからFastq形式でファイルを取得し、Qiime2でメタゲノム解析を行う手順を説明します。なお、この手順は2020年5月時点の情報に基づいて記載しています。
▼もくじ
FileExporterプラグインでFastqファイルを取得
Ion Torrentの出力はBamファイルという、バイナリファイルとなっています。FileExporterというプラグインを用いて塩基情報とQuality情報のみが含まれたテキスト形式のFastqファイルを取得します。プラグインの実行手順を以下に示します。ZipファイルにFastqファイルがまとめて保存されます。Fastqファイルの参照はサクラエディタ、秀丸エディタ等のテキストエディタが便利です。
Qiime2環境をWindows PC上に構築
Qiime2の環境構築についてはQiime2のサイトのInstalling QIIME 2に手順が記載されています。Qiime2はメモリを大量に使い、またデータ量が大きい場合は処理時間がかかるため、可能であればLinux™サーバー上にcondaで環境を構築するのが便利です。一時的であればさくらサーバーやAmazon等のクラウドを用いる方法も考えられます。
今回はWindows™ PC上に環境を構築します。Windows上に構築する場合は、VirtualBoxもしくはDockerを利用する方法があります。どちらもWindows上に仮想のLinux環境を構築するので、ディスクスペースとメモリ容量が必要となります。今回、筆者の環境ではDockerを用いています。Dockerのサイトにアクセスし、Docker Desktopをダウンロード、インストールします。起動の際には無料で登録できるDockerアカウントが必要です。
デフォルト設定ではメモリを2 GB利用することになっていますが、ある程度大きくしないとメモリ不足で処理が異常終了します。また、ファイルの共有のために共有ドライブの設定を行います。
次にWindowsのPowerShellを起動しコマンドラインにアクセスします。
Docker pullコマンドでQiime2環境のインストール(以下はversion2020.2の例。バージョンは最新のものを取得することを推奨)を行います。
Windowsの作業ディレクトリ(以下の例ではC:\Qiime2)を/dataにマウントするようにして、Qiime2環境に入ります。
Qiime2のサイトのData resourcesのページにてGreengenesやSILVAといったデータベースから
作成したリファレンスを取得することが可能です。ダウンロードして共有ディレクトリ(C:\Qiime2\ref\等)に格納します。
FastqファイルをQiime2で解析
共有ディレクトリ(C:\Qiime2\input\等)にダウンロードしたFastqファイルを格納します。
次にFastqファイルの情報を記載したManifestファイルを作成します。例を以下に示します。
また、後々解析で利用するMetaDataファイルも作成します。これはサンプルの属性を記載するファイルで、記載した属性を切り口として解析やビジュアライズを可能とするものです。例を以下に示します。実際はタブ区切りテキストファイルです。
Qiime2のコマンドをPowerShellのコマンドラインにて実施します。Qiime2は処理に自由度をもたせるために1つ1つの手続きが独立しています。
たとえば、FastqデータをQiime2に読み込む場合は、以下のコマンドを実行します。
もしコマンドがエラーとなった場合は赤でエラーメッセージが表示されます。
正常に終了した場合は緑で結果が表示されます。
Importが終了したら、以下のコマンドを順に実行します。記載が冗長となるため引数を省略しています。各コマンドの詳細については、Qiime2のマニュアルもしくはコマンドヘルプ(例:qiime tools import –help)を参照願います。
Qiime2の出力ファイルの拡張子qzvのファイルはビジュアライズ用です。Qiime2 viewのページにqzvファイルをドラッグアンドドロップすることでビジュアライズが可能です。
まとめ
Ion Torrentのシーケンス結果からFastqファイルを取得し独自のパイプラインでメタゲノム解析を行なった例を紹介させて頂きました。今回はQiime2のパイプラインをWindows PC上に構築し、Ion Torrentのデータにて処理が流れることを確認しましたが、パラメーターの最適化などには踏み込んではいません。
なお、当社製品以外は無償サポートの対象外となります。当社のクラウドサービスIon Reporterでもメタゲノムの解析が可能です。こちらも併せてご利用頂ければと思います。メタゲノムに限らず、各種アプリケーションの解析について 次世代シーケンス(NGS)データ解析 コンサルティングサービス にて対応させて頂くことが可能です。
ご不明な点につきましては弊社テクニカルサポートまでご連絡願います。
次世代シーケンサ(NGS)入門
次世代シーケンスの原理や何ができるかがよくわからない、または自分の研究領域にどのように活用できるかわからないという方向けに、次世代シーケンスの基本や各研究領域に特化したアプリケーションをまとめました。リンク先から、それぞれの領域に応じたページをご覧いただけます。
次世代シーケンス データ解析オンライン個別相談
IonTorrentユーザでデータ解析に関する具体的な課題をお持ちの方には、無料の個別相談の時間を開設しています。
研究用にのみ使用できます。診断用には使用いただけません。