NGSデータ解析まとめ

サカナ研究者の手探りNGS解析(おもに進化生物学)

系統解析・ゲノム解析に使用するソフトのインストール(Windows, Mac)

以下は、2025年1月15-17日に九州大学大学院で行う予定の集中講義の資料としてまとめています。一種のメモなので、当日まで、随時修正・更新します。

はじめに

このポストでは、系統解析やゲノム・トランスクリプトーム解析に使用するソフトウェアツールのインストールについて、それぞれのソフトウェアのインストールサイトと、インストールの際の注意点についてまとめました。基本的にWindows 11またはMac OSの使用を前提にしています。ここではGUIでインストールするものに絞って記述します。Linuxのターミナルからconda installするプログラムについては、使用のさいに別途解説します。

1. 一般的に使用するソフト

(1) Sublime Text(テキストエディタ

www.sublimetext.com

無料で使用できる、比較的軽量でシンプルなテキストエディタです。Windows, Macの両方に対応しています。
系統解析ではテキストファイルを頻繁に使用するので、メモ帳よりも高機能なエディタがあると快適です。

(2) RとR studio(統計解析)

posit.co

統計解析パッケージのRは、系統解析、ゲノム解析でも必須のツールです。ここではまず最新版のRをインストールし、次にRの実行環境であるR studioをインストールします。(WIndows, Mac版両方あります)

2. 分子系統解析

(1) MEGA 11

www.megasoftware.net

言わずと知れた有名な系統解析パッケージです。進化分野以外の研究者が系統樹を書くときは、まずMEGA11を使うのではないでしょうか? WindowsMacどちらでも使えますが、やはりWindowsの方が安定しているような気がします。無料で使用できます。配列のアラインメントエディタや、系統樹のエディタも付いています(MEGA 11では系統樹エディタがかなり良くなりました。FigTreeが苦手な人はこちらが良いかも)。

(2) SeaView

https://doua.prabi.fr/software/seaview

塩基配列のアラインメントエディターで、使いやすいと思います。アラインメントレベルでアミノ酸への翻訳、アラインメントの修正、簡単な系統樹作成が可能です。また、配列ファイル形式の変換にも対応しています。Windows, Macどちらも対応しています。ブラウザによっては、リンクがセキュリティでブロックされることがありますが、大丈夫のようです。

(3) FigTree

tree.bio.ed.ac.uk

系統樹ファイルのエディタ・ビューアです。Javaで動いています。Windows, Macどちらにも対応しています。ブラウザによっては接続がブロックされることがあります。

3. ゲノム解析

(1) Integrated Genome Viewer (IGV)

igv.org

IGVはゲノムビューアの一種で、ゲノム配列をはじめ、参照ゲノムにマッピングされたリード(BAMファイル)や遺伝子情報のアノテーション(GFF3ファイル)、多型の情報(VCFファイル)を同時に開くことで、ゲノム上のさまざまな情報を可視化することができます。Javaで動いており、Windows, Mac, Linuxのいずれでも使用できます。