NGSデータ解析まとめ

サカナ研究者の手探りNGS解析(おもに進化生物学)

R

Rを使って、ゲノム上に遺伝子の位置を表示する

多重遺伝子の分子進化や、複数遺伝子座を使った系統解析で、個々の遺伝子のゲノム上の位置を示した図を作りたい時がありますが、そういう時に使える簡単な方法を調べたところ、以下のサイトがありました。https://stackoverflow.com/questions/33727432/how-…

MiSeqデータのMHC領域へのマッピング(17):RによるVCF fileの操作 (3): SNPのゲノム上での位置と、対立遺伝子頻度との関係をグラフ化する

2015-06-223. 各SNPのゲノム上の位置と、allele frequencyとの関係をグラフ化する(散布図の作成)各SNPごとのallele frequencyを求めたので、ゲノム上での各SNPのallele frequencyの分布を視覚化してみます。ここでは、Rの"plot"関数を使用します。まず、以…

MiSeqデータのMHC領域へのマッピング(16):RによるVCF fileの操作 (2):VCF fileから必要な情報を抽出する

2015-06-222. VCF fileから必要な情報を含む列のみを抽出し、新しいtableを作る Variant Effect PredictorでアノテーションをしたVCF fileには様々な情報が含まれていますが、そのままでは情報が多すぎて、ちょっと見づらいです。Rを使うことで、必要な情報…

MiSeqデータのMHC領域へのマッピング(15):RによるVCF fileの操作 (1): SNPごとの対立遺伝子頻度(allele frequency)および遺伝子型頻度(genotype frequency)の計算

2015-06-22ここでは、Rを使ってVCF fileに含まれる情報を整理する方法を考えます。具体的には、 VCF fileに含まれる各sampleのgenotype情報から、SNPごとの対立遺伝子頻度(allele frequency)および遺伝子型頻度(genotype frequency)を求める VCF fileか…

MiSeqデータのMHC領域へのマッピング(14):Variant Effect PredictorによるSNPのアノテーション(その3)

2015-05-18ここでは、Variant Effect Predictorで得られたアノテーション情報を含むVCF formatファイルをダウンロードして、Rで読み込む方法を解説します。4. アノテーション情報を含むVCFファイルをダウンロードする解析結果の画面(前回の内容参照)で、設…

MiSeqデータのMHC領域へのマッピング(10):VCF fileをRに読み込む

2015-04-13MiSeqデータのMHC領域へのマッピング(7):samtools mpileup, bcftoolsでSNPsを抽出する - NGSデータ解析まとめ(1) VCF fileの修正(下準備) まず、上記エントリで作成したVCF formatのファイル(MHC_test4.var.vcf)を、テキストエディタで開い…

MiSeqデータのMHC領域へのマッピング(8):Rのインストール

2015-04-13ここから、VCF formatのファイルを読んで、必要な情報(SNPサイト、SNPの位置・allele頻度、既知のSNPsとの関連など)の抽出を進めていきます。ここからの解析は、おもに統計パッケージのRを使用します。Rは以下のURLから、リンクをたどって入手、…