弊社が提供するフリーのソフト(TAC:Applied Biosystems™ Transcriptome Analysis Console)を使うことで、マイクロアレイによる遺伝子発現データをどなたでも自由に解析できます。前回は「フリーのマイクロアレイ解析ソフトを使って解析データに異常がないか確認してみよう!」で解析結果に異常がないか確認を行いました。今回は、解析実行データの見方についてご紹介します。
▼もくじ
解析結果を見てみよう
解析結果を見るには、TAC左上の「Gene View」をクリックします。
そうすると、下記のような解析画面が開きます。
まずはこの画面についてみていきましょう。
左側の画面には遺伝子のリスト(Gene Table)が表示されています。画面下に発現変動のあった遺伝子の数が記載されていますので、確認してみてください。
ではまず、この左側の遺伝子リスト(Gene Table)について詳しく見ていきましょう。
それぞれの列の意味は下記のとおりです。
このように、TACでは発現変動のあった遺伝子のシグナル値やp値、Gene Symbolが一目でわかるようにデザインされています。
グラフデータを見てみよう~スキャッタープロット (Scatter Plot)
続いて右側の画面に着目してみましょう。こちらはLiverとMuscleの発現量を比較したスキャッタープロット (Scatter Plot) です。赤いプロットはLiverで発現が上昇している遺伝子、緑のプロットはLiverで発現が減少している遺伝子を表しています。灰色のプロットは、LiverとMuscleでの発現変動が2倍以下のために、解析から除外された遺伝子です。
実は右側のスキャッタープロットと左側の表は連動しています。試しにスキャッタープロットの任意の部分をマウスで囲ってみましょう。選択された部分は青くプロットされ、対応する遺伝子が表の中でハイライトされます。
逆に表の中の任意の遺伝子をクリックすると、その遺伝子に対応したプロットがスキャッタープロットで青く表示されます。
条件をいろいろと変えてみよう
次に、解析対象となる遺伝子を選ぶための条件をいろいろと変えてみましょう。
デフォルトの設定では、発現変動が2倍より大きく、かつANOVA p-valueが0.05未満のものが表示されるようになっています。この条件は「Fold Change」と「P-value」のところに、矢印と漏斗(ろうと)のアイコンからも確認できます。
これは、「Fold Change」と「P-value」にフィルターがかかっていることを意味します。
今回はこの条件を、発現変動が10倍より大きいものに変更してみます。漏斗(ろうと)のアイコンか、「Fold Change」と記載されているセルを右クリックします。次に右クリックメニューより「Filter」を選択してください。
すると下記のようなボックスが表示されます。今はデフォルトの値が入っていますので、上側に「-10」、下側に「10」と入力してOKボタンを押し、新しい条件でフィルターをかけてみましょう。
これにより、10倍より大きく発現変動している遺伝子が新たに選び出されます。また、右側のスキャッタープロットは新たに選び出された遺伝子に対応した表示に変更されます。なお選び出された遺伝子数は表の下に表示されます。
Fold Changeやp-value以外の列にもフィルターをかけることができます。フィルターするには、列のタイトルの上で右クリックし、「Filter」をクリックしてみてください。
●数字列の場合(Fold Change、p-valueなど):
ドロップダウンから<や=などを選択し、空欄に数値を入力できます。
●文字列の場合(Gene Symbol、Descriptionなど):
ドロップダウンから<や=などを選択し、空欄に数値を入力できます。
グラフデータを見てみよう~ボルケーノプロット(Volcano Plot)
では次にボルケーノプロットを見てみましょう。Scatter Plotの右横のタブ、Volcano Plotをクリックしてください。
Volcano PlotもScatter Plotと同じく散布図ですが、X軸とY軸が異なり、視覚的に火山の噴火に似ているためVolcano Plotと呼ばれています。
X軸はFold Changeで、1を中心として右側に行けば行くほど大きく、左側に行けば行くほど小さくなります。
Y軸はp値(-log10)で、上に行けば行くほどp値が小さくなります。
つまりVolcano PlotではFold Changeが大きく(発現量比が大きく)、p値が低い(有意差がある可能性が大きい)遺伝子ほど、グラフの上部の両端に位置することになります。
このように、視覚的に発現差異が生じている遺伝子を確認することが可能です。
グラフデータを見てみよう~変動遺伝子のクラスタリングとヒートマップの作成
では次に階層クラスタリングを見てみましょう。Volcano Plotの右横のタブ、Hierarchical Clusteringをクリックしてください。
該当遺伝子数を5000未満にまで絞りこんだときにのみ表示させることができます。
もし、画面に下記のメッセージが表示されていたら、左側の表のフィルター条件を厳しくして(たとえばFold Change 2倍以上のフィルターを5倍以上に変更するなど)、該当遺伝子を5000未満まで絞りこんでみましょう。
該当遺伝子数は、左側のGene Table下に「Count」として表示されています。(下記の例では、該当遺伝子は6558個です)
該当遺伝子数が5000未満になり、「Perform Clustering」と表示が出たら、これをクリックしましょう。
しばらくすると、下記のようなヒートマップが作成されます。
このヒートマップでは、最上段の青と赤がCondition(群)を表し、その下は各サンプルのCondition1とCondition2の発現量に応じた色が赤と青で表示されています。
また、上部の「+」と「-」のバーからヒートマップの拡大縮小が自由にできます。見たい部分をドラッグして選択する方法をしても拡大できます。
拡大をすると、下図のように遺伝子名が見えてきます。この遺伝子の並びは、各Condition(群)の発現量のパターンから、類似性が高いペアやサンプル間でシグナル傾向が似ているペアを見つけ、その結果をもとにヒートマップを作成しています。
グラフデータを見てみよう~Wikipathways(ウィキパスウェイ、パスウェイ解析)
では次にHierarchical Clusteringの右横のタブ、Wikipathwaysを見てみましょう。
このWikipathwaysによるパスウェイ解析を実行するには、TACで解析をしているパソコンがインターネットに接続されている必要があります。インターネット上のWikipathwaysをTACがダウンロードし、発現解析の結果とリンクさせて表示するためです。
Wikipathwaysのダウンロードが終わると、下図のようにPathwayのリストが表示されます。それでは、例として上から2番目のPathwayをダブルクリックしてみましょう。
そうすると、下図のようにWikipathwaysが表示されます。
このままでは見づらいので、拡大して見てみましょう。拡大は、パスウェイ上部の虫眼鏡アイコンまたは%のボタンから行います。
拡大した画像を見てみましょう。さまざまな遺伝子が、緑、赤、斜線、白と分かれているのがわかります。
それぞれの遺伝子の色分けの意味は、下記のとおりです。
赤:Up-regulatedの遺伝子
緑:Down-regulatedの遺伝子
斜線:現在のフィルタリング条件からフィルターアウトしている遺伝子
白:別名で登録されている遺伝子やタンパク質、代謝産物など遺伝子以外の情報
まとめ
今回はフリーの解析ソフトであるTACを使い、マイクロアレイデータを用いて遺伝子発現解析をするための基本的な使い方について解説していきました。
次回はいよいよ応用編として、「フリーのマイクロアレイ解析ソフトを使って選択的スプライシングを解析してみよう!」にて、TACを使った選択的スプライシング (Alternative Splicing) 解析の方法について見ていくことにしましょう。
TACを用いた遺伝子発現解析の手順(動画)
このブログの内容を動画でご覧いただけます。
マイクロアレイの手引き
DNAマイクロアレイは登場してからすでに20年が経ち、同じように網羅的な発現解析が出来る次世代シーケンサーの普及もあって、熟成した技術と言えます。しかしマイクロアレイは次世代シーケンサーに比べてコスト的なメリットがあり、また解析の容易さなどから、まだまだ強力な網羅的な遺伝子発現解析が出来る技術として、近年見直されて来ている技術でもあります。
この手引きはそのマイクロアレイの原理や基礎、ワークフローなどについて学べるページです。
研究用にのみ使用できます。診断用には使用いただけません。