NGSデータ解析まとめ

サカナ研究者の手探りNGS解析(おもに進化生物学)

MiSeqデータのMHC領域へのマッピング(3):bwaによるマッピング

2015-03-05

(1) bwaを用いた解析
i) リファレンス配列のindexの作成
まずは、リファレンスとなる配列(ここではヒトゲノムChr.6)の indexを作成する。Macの性能にもよるが、5分程度かかる。

bwa index -a bwtsw Homo_sapiens.GRCh38.dna_rm.chromosome.6.fa

ii) NGS readsのリファレンスへのマッピング
以下のコマンドを実行する。個々のリードが長い(250bpなど)場合、"bwa mem"を使用する。
"-t 4"は使用するthreads数を指定するoption(ここでは4と指定 // 8 coreなら8でも可)

bwa mem -t 4 Homo_sapiens.GRCh38.dna_rm.chromosome.6.fa DRR003760.fastq > DRR003760.sam	# bwa memというオプション(比較的長いreadsに対応)

Outputとして.samのファイルができる。次回は、samtoolsを使ったsam -> bam変換、bam sorting, bam indexの作成など。