NGSデータ解析まとめ

サカナ研究者の手探りNGS解析(おもに進化生物学)

MiSeqデータのMHC領域へのマッピング(17):RによるVCF fileの操作 (3): SNPのゲノム上での位置と、対立遺伝子頻度との関係をグラフ化する

2015-06-22

3. 各SNPのゲノム上の位置と、allele frequencyとの関係をグラフ化する(散布図の作成)

各SNPごとのallele frequencyを求めたので、ゲノム上での各SNPのallele frequencyの分布を視覚化してみます。ここでは、Rの"plot"関数を使用します。

まず、以下のようにコマンドを入力します。

plot(MHC_test4_freq[,2],MHC_test4_freq[,11],pch=20,cex=0.5,col=4)

plot関数は、引数の1番目(MHC_test4_freqの2列目)と2番目(MHC_test4_freqの11列目)の散布図を作ります。

この状態では、6番染色体のかなり広い範囲でのSNPsのallele frequencyがplotされているので、範囲を絞ります。たとえばHLA-Aの位置はchr6の29942470-29945884なので、この範囲に絞ります。この場合、xlim=c(範囲開始, 範囲終わり)というオプションを指定します。

#位置29942001から29946000までを表示
plot(MHC_test4_freq[,2],MHC_test4_freq[,11],pch=20,cex=0.5,col=4,xlim=c(29942001,29946000))

その他のMHC (HLA)遺伝子の位置はこちら

参考URL:
plot関数の基本的な使い方:
R言語で統計解析入門: plot()関数を使った散布図の作図体験 梶山 喜一郎
plot関数のオプションなど:
http://cse.naro.affrc.go.jp/takezawa/r-tips/r/53.html