NGSデータ解析まとめ

サカナ研究者の手探りNGS解析(おもに進化生物学)

GATKのインストールについて

VCFファイルの解析に使用するツールとしてGATKをダウンロード、インストールしました。以下は個人的なメモです。

GATKのインストールには、以下の本のP.149-154を参照しました。

www.amazon.co.jp

(1) 下準備

今回インストールしたコンピュータはMacBook Air 11inch, OSは10.9.5です。

Macの場合、おそらくjavaをアップデートする必要があります。GATKはJava 1.7を想定していますが、Mac OS XにインストールされているJavaは1.6のようです(10.9.5の時点では)。

ターミナルを立ち上げて、以下のコマンドでJavaのバージョンを確認します。

java -version

以下のような結果が出ます。

java version "1.6.0_65"
Java(TM) SE Runtime Environment (build 1.6.0_65-b14-462-11M4609)
Java HotSpot(TM) 64-Bit Server VM (build 20.65-b04-462, mixed mode)

ここでversionが1.6であれば、1.7をインストールする必要があります。

以下のサイトからJava SE Development Kit 7u79のインストーラをダウンロードして実行します。

Java SE Development Kit 7 - Downloads | Oracle Technology Network | Oracle

(2) GATKのダウンロード

以下のサイトからGATKをダウンロードします。最新バージョンは3.5です。ダウンロードの際にユーザ登録が必要です。

www.broadinstitute.org

(3) GATK関連ファイルのダウンロード

上記の本を参考にして進めました。数時間かかります。