VCF format
VCFファイルの解析に使用するツールとしてGATKをダウンロード、インストールしました。以下は個人的なメモです。GATKのインストールには、以下の本のP.149-154を参照しました。www.amazon.co.jp(1) 下準備今回インストールしたコンピュータはMacBook Air 11i…
以前、VCFファイルから必要なデータを抽出する方法として、Rを使う方法を少し書きました。複雑な操作をする時はRが便利と思いますが、比較的簡単な操作(たとえば特定の情報を持つSNPsの行を抽出する場合など)を行う場合は、UNIXのコマンドである"grep"を利…
2015-08-06Mapping結果の.bam fileから、SNPなどの多型を抽出して、VCF formatのfileを生成します。その後、Variant Effect Predictorを使ってSNPのアノテーションを行います。方法は以前紹介したこのエントリ(VCF fileの生成)や、このエントリ(Variant E…
2015-06-223. 各SNPのゲノム上の位置と、allele frequencyとの関係をグラフ化する(散布図の作成)各SNPごとのallele frequencyを求めたので、ゲノム上での各SNPのallele frequencyの分布を視覚化してみます。ここでは、Rの"plot"関数を使用します。まず、以…
2015-06-222. VCF fileから必要な情報を含む列のみを抽出し、新しいtableを作る Variant Effect PredictorでアノテーションをしたVCF fileには様々な情報が含まれていますが、そのままでは情報が多すぎて、ちょっと見づらいです。Rを使うことで、必要な情報…
2015-06-22ここでは、Rを使ってVCF fileに含まれる情報を整理する方法を考えます。具体的には、 VCF fileに含まれる各sampleのgenotype情報から、SNPごとの対立遺伝子頻度(allele frequency)および遺伝子型頻度(genotype frequency)を求める VCF fileか…
2015-05-18ここでは、Variant Effect Predictorで得られたアノテーション情報を含むVCF formatファイルをダウンロードして、Rで読み込む方法を解説します。4. アノテーション情報を含むVCFファイルをダウンロードする解析結果の画面(前回の内容参照)で、設…
2015-05-18Variant Effect PredictorによるSNPのアノテーション結果について説明します。3. アノテーション結果を見る(1) Summary statistics 解析がうまく行くと、このような結果の画面を見ることができます。ここでの表と円グラフは、結果全体の要約になっ…
2015-05-18以下の記事も参考にしています。ショートリードの憂鬱 - 次世代シーケンサー: Ensembl - Variant Effect Predictor でSNPアノテーションここでは、データをリファレンスにマッピングすることで得られた多型(SNP)サイト(7回目の内容も参照)の情…
2014-04-13VCF fileのフォーマットについては、以下のURLにあるPDF fileに説明されています。ここでは、VCF formatによるDNA多型(SNPおよびindel)の記述方式を読み解いていきます。http://samtools.github.io/hts-specs/VCFv4.1.pdfまず、VCF formatについ…
2015-04-13MiSeqデータのMHC領域へのマッピング(7):samtools mpileup, bcftoolsでSNPsを抽出する - NGSデータ解析まとめ(1) VCF fileの修正(下準備) まず、上記エントリで作成したVCF formatのファイル(MHC_test4.var.vcf)を、テキストエディタで開い…