シーケンス解析で、ノイズピークが検出されたり、ピークが二重になって検出されたりすると、該当領域の塩基配列を良好な精度で解読することができません。本ブログでは、このようなデータトラブルについて、予測される原因と対処をご紹介いたします。
▼もくじ
スパイクノイズ
シーケンス解析データに、幅の狭いスパイクノイズが検出され、拡大すると4色全てのピークが見られる場合(図1)、気泡などの影響が考えられます。スパイクノイズが検出された場合の対処法は下表のとおりです。
予測される原因 | 対処法 |
気泡、結晶などが検出部を通過 | <3500※1、SeqStudio Flex※2、3730xl LV※3システム>
<SeqStudioシステム※4>
<3730xl LVシステム>
|
ポリマー(SeqStudioシステムの場合はカートリッジ)が推奨の使用期限を超過していた |
|
決まった領域に赤と青の大きなノイズピーク
シーケンス解析データの決まった領域(70 bp、120 bp、200 bp付近)に、赤と青の大きなノイズピークが検出された経験はありますか?これは、蛍光標識ジデオキシヌクレオチド(ダイターミネーター)がキャピラリー中に取り込まれて検出されたピークで、Dye Blobピークと呼ばれます。シーケンス反応後の溶液中には、多くの場合、反応に使われなかったダイターミネーターが残存します。シーケンス反応後の精製で、これらの余剰のダイターミネーターを除去しきれなかった場合、Dye Blobピークが検出されます(図2)。
ダイターミネーターが精製で除去しきれない原因は、大きく分けて二つあります。一つは、シーケンス反応後の精製不良、もう一つは、シーケンス反応不良です。どちらか判別するためには、Raw Dataを確認します。Applied Biosystems™ Sequencing AnalysisソフトウエアでRaw Dataを確認する手順は、こちらをご参照ください。図3 (a)のように、Dye Blobピークとシーケンス反応産物のピークの両方が検出されている場合は精製不良、(b)のようにシーケンス反応産物のピークが小さい、あるいは、検出されていない場合はシーケンス反応不良と考えられます。
それぞれの原因に対する対処法は下表のとおりです。
予測される原因 | 対処法 |
シーケンス反応は進んでいるが、反応後の精製でダイターミネーターを除去できていない(図3 (a)) | シーケンス反応産物の精製方法を変更;
|
BigDye XTerminator Purification Kitを使用している場合、シーケンス反応産物と試薬との混合が不十分 |
|
BigDye XTerminator Purification Kit を使用している場合、Applied Biosystems™ XTerminator™ Solutionの添加量が少ない |
|
シーケンス反応が進まず、多量のダイターミネータが残存している(図3 (b)) | シーケンス反応が進まない要因を検証;
|
二重ピーク
シーケンス解析で得た波形が二重になる原因はさまざま考えられます。以下に、二重ピークとなったデータの状態に応じた原因と対処法をご紹介します。
シグナル強度が高すぎることによる二重ピーク
シーケンス解析で得られたElectropherogramで、メインピークの下に二次ピークが検出され、二重ピークとなっている場合、シグナル強度が高すぎるかもしれません。シグナル強度は、Sequencing AnalysisソフトウエアのRawタブやAnnotationタブから確認できます(確認方法はこちら)。
Rawタブで表示される「Raw Data」のピーク高は、ジェネティックアナライザで検出された蛍光シグナルの強度を示します(単位:RFU)。3500、SeqStudio Flex、SeqStudio、3730xl LVシステム、いずれのジェネティックアナライザも、検出できる蛍光シグナルの上限は32,000 RFUです。Raw Dataのピーク強度が32,000 RFUに近い、あるいは超えている場合は、シグナル強度が高すぎます。
Annotationタブに示される「Ave Signal Intensity」には、塩基ごとの平均シグナル強度が表示されます。この数値が10,000を超える場合、シグナル強度が高すぎると判断できます。
シグナル強度が高すぎることで二重ピークとなった場合の対処法は下表のとおりです。
予測される原因 | 対処法 |
シグナル強度が高すぎる | ローディングするシーケンス産物の量を減らして再度ランする <ローディング量を減らす方法>
|
シーケンスの開始時のみ二重ピーク
シーケンス開始時のみ二重ピークとなった場合(図5)、用いたプライマーのデザインに問題があるかもしれません。予測される原因と対処法を以下に示します。
予測される原因 | 対処法 |
シーケンス反応のテンプレートとしたPCR産物にプライマーダイマーが含まれていた |
|
シーケンス反応のテンプレートに、複数のプライマー結合領域がある |
|
きれいなシーケンス後に二重ピーク
ダイレクトシーケンス法では、ゲノムDNAの解析したい領域をPCR増幅し、得られたPCR増幅産物を鋳型として塩基配列を決定します。シーケンス波形の途中から二重ピークとなる場合、解析領域に塩基の挿入や欠失が存在する可能性が考えられます。
予測される原因 | 対処法 |
解析領域に挿入/欠失がある |
|
※1 Applied Biosystems™ 3500/3500xLジェネティックアナライザ
※2 Applied Biosystems™ SeqStudio™ 8 Flex/24 Flexジェネティックアナライザ
※3 Applied Biosystems™ 3730xl DNAアナライザ (Latest Version)
※4 Applied Biosystems™ SeqStudio™ ジェネティックアナライザ
※5 Applied Biosystems™ Variant Reporter™ ソフトウエア、SeqScape™ ソフトウエア
※6 クローン化した配列をベクターに組み込み塩基配列を読む方法
まとめ
今回は、シーケンス解析データでみられるノイズピークと二重ピークについて、その原因と対処法をご紹介しました。シーケンス波形は得られているのに、ノイズピークや二重ピークによりデータのクオリティが下がってしまった場合は、本ブログの内容がトラブル解決のための一助となるかもしれません。
キャピラリー電気泳動によるシーケンス解析について、より詳しく知りたい方は、下記よりサンガーシーケンスの基本原則を学べる資料をダウンロードいただけます。
サンガーシーケンシング ハンドブック
シーケンシングラーニングセンターから、シーケンス解析に関する各種技術情報にアクセスしていただくこともできます。また、シーケンス解析の基礎セミナーやハンズオントレーニングもございますので、ぜひご活用ください。
サンガーシーケンス解析基礎セミナー(1)基本原理
サンガーシーケンス解析基礎セミナー(2)データ確認とトラブルシュート
完全マスター!ハンズオントレーニングコース キャピラリーシーケンサ(1) サンプル調製からデータ確認まで
研究用にのみ使用できます。診断用には使用いただけません。