NGSデータ解析まとめ

サカナ研究者の手探りNGS解析(おもに進化生物学)

2024.2.19の近況

何だか2月とは思えない暖かい日が続いて、かと思うと急に寒くなったり、体調を維持するのが大変な感じです。10月から始めた早朝ジョギングの成果か、腰回りが「若干」スマートになったような気がする今日この頃です。(2024.2.19) アーモンドの花(大学構内に…

2024.1.4の近況

北陸の震災で被害を受けられた方々には、心よりお見舞い申し上げます。2024年になりました。今年は、年始からいろいろ大変な状況が続いていますが、こういう時はまず落ち着いて、自分の持ち場で、自分のできること、するべきことを粛々と進めることが大事だ…

2023.12.29の近況

昨年の終わりにHPに書いた近況ですが、ちょっと今年の抱負でもあります。今年は、機会があれば生物多様性の重要さと保全について、身近なところで話をしたり、自分なりに何らかの活動ができれば、思います。あ、あと今年はうちのベランダで、湿地帯ビオトー…

GenBankに公開されている魚類ゲノムのファイルを一括でダウンロードする

以下は、ほとんど自分用のメモ。 ncbi-genome-downloadなどを使って、NCBI Genomeの魚類ゲノムをまとめてダウンロードしたい場合、"vertebrate_other"を指定すると魚類以外の脊椎動物のゲノムも一緒にダウンロードされてしまうので、ちょっとした工夫が必要…

2023.10.2の近況

暑さ寒さも彼岸まで、とはよく言ったもので、秋分の日を過ぎたらちゃんと秋らしくなってきました。今週はひさしぶりにフィールドに行く予定があり、楽しみです。(2023.10.02)(10/25追記:フィールドの様子) 川の様子(調査地ではありません)採集したタナゴ…

Rを使って、ゲノム上に遺伝子の位置を表示する

多重遺伝子の分子進化や、複数遺伝子座を使った系統解析で、個々の遺伝子のゲノム上の位置を示した図を作りたい時がありますが、そういう時に使える簡単な方法を調べたところ、以下のサイトがありました。https://stackoverflow.com/questions/33727432/how-…

2023.6.11の近況

気がついたらもう梅雨になっていました。毎日何かと忙しく過ごしているうちに、日々が過ぎていきます。息子の成長と、自分が少し歳を取ったことを感じます。(2023.6.11)伊勢田の弁天様にお参りをしています。 伊勢田の弁財天

2023.3.7の近況

3月に入ってだいぶ春らしくなってきました。昔からこの時期は花粉症が酷かったのですが、数年前に舌下免疫療法を試したところ、昨年くらいから症状がかなり改善して、だいぶ過ごしやすくなりました。ありがたいことです。(2023.3.7)

BRAKER3による遺伝子予測(ベンチマーク編)

BRAKER 3.0.0をインストールしたので、それぞれの遺伝子予測方法の結果を比較してみた。インストール編はこちら。 Brakerによる遺伝子予測 GeneMark-EXおよびAUGUSTUSのtrainingに使用する配列情報により、3つの方法が提案されている。 Braker1: トランスク…

BRAKER3による遺伝子予測(インストール編)

2023年3月3日、遺伝子予測プログラムBrakerの改良版であるBraker3が公開された。Brakerは、RNA-seqなどのtranscriptsをhintとしてゲノム中の遺伝子予測を行うBraker1と、近縁種などのタンパク質アミノ酸配列をhintとして遺伝子予測を行うBraker2があるが、Br…

2023.1.4の近況

2023年になりました。今年もよろしくお願いします。年末年始は、2年ぶりに広島の実家に帰省して過ごしました。実家では、なんというか息子の成長を感じました。ところで、帰省中の空いた時間に読んでいた、生物の新種発見についての本がとても面白かったです…

自分が嫌いだけど好きだった、若い頃の自分へ

「自傷的自己愛」の精神分析 (角川新書)作者:斎藤 環KADOKAWAAmazon斉藤環さんの「自傷的自己愛」の精神分析、とても面白い本だった。この本で書かれている自傷的自己愛というのは、自己評価が低くて、自分はダメな人間だ、とずっと思いながらも、そんな自分…

GPUを使ったNanoporeのベースコール比較

NanoporeのMinIONによるロングリードのゲノム決定において、解析のネックとなるのはベースコールであろう。10-20 Gbpのデータであると、outputのFAST5ファイルからベースコールを行うと、guppyのCPU版だと1ヶ月くらいかかることがある。しかしながら、GPUを…

Ubuntu 20.04を入れたノートパソコンでeGPUを使えるようにする

Ubuntu (20.04 LTS)を入れたノートパソコンでeGPUのセッティングをしたので、備忘録的なメモを書いておく。 eGPUの主な使用目的 Nanopore MinIONで読んだゲノム配列のベースコール(guppy_basecaller, dorado) NextGenMapなどによるショートリードのリファレ…

2022-12-26の近況

とても忙しかった2022年も、残すところあと1週間になりました。最近、自分の研究に対するモチベーションが上がっているな、と感じます。あとは頑張って研究を進めて、論文を書くのみであります(2022.12.26)

生き物を観察することと、世界をより深く「見る」こと

忙しかった2022年もあと2日で終わるけれど、今日も研究室に来て仕事をしている。今年読んだ本で、一番感銘を受けたのは「図鑑を見ても名前がわからないのはなぜか?」という、自然史の研究者による、生物の「同定」についての本だ。といっても難しい専門書で…

NanoporeロングリードからのアセンブラNECATとNextDenovo

最近使用しているNanopore (MinION)のロングリードからのアセンブラ2つ(230203現在:更新しながら公開しています)。 解析環境 Linux (Ubuntu 16.04 LTS) Intel® Xeon(R) CPU E5-2640 v4 @2.40 GHz x 40 (40 threads), 512 GB RAM アセンブラ NECAT github.…

2022-12-06の近況

12月になって、急に冬らしくなりました。最近は、講義の合間に停滞気味の研究を進めつつ、12/21-23の九州大学大学院での集中講義の準備に追われています。今年は本当に忙しい年のようです。。(2022-12-06)おまけ 年末の九大での集中講義は、雪が降ってびっ…

2022-11-14の近況

すっかり秋です。食欲の秋で食べ物が美味しいので、最近はやや体重が増加傾向です・・・ また、そのせいかわかりませんが、ぎっくり腰になってしまいました。幸い今回は歩くことはできるくらい軽いのですが、中腰になってものを拾ったり、重いものを持ったり…

2022-09-29の近況

HPに記述している近況、時々書き換えていますが、過去のものを残しておきます。先週から後期の講義が始まりました。最近、教養課程で生物学を学ぶことの意味や必要性について、考えることが多いです。もちろん医学部の専門課程に繋げるための知識としても、…

2022年(現況報告など)

全然更新していないですが、生きています。 2021年の目標、なかなか達成できてないところもありますが、新型コロナも社会的には落ち着いてきたので、今年はさらに頑張りたいと思います。 5月17-19日は、3年ぶりに福岡県にタナゴ調査に行きました。

2021年の抱負・目標

気がついたら2021年になっていました。全然更新していませんが、今年はいろいろ頑張りたいと思います。2020年は、コロナ禍で本当に大変な年でした。今年に入ってもまだ収束の気配はないばかりか、さらに感染拡大が進んでいて不安になりますが、ワクチンその…

軽快なalignment editorのAliView

Macを使っていると、大昔のMacCladeの代わりになるアラインメントエディタがなくてちょっと困ったりする。さすがにもうMacCladeは使えないので、何かないかといつも悩んでいたが、今回見つけたAliViewというソフトが決定版かもしれない。ormbunkar.se軽快な…

2020年の目標など

2020年になりました。ブログ休眠中ですが、今年は少しずつデータ解析のことを書きたいと思います。 今年の仕事目標は、(1) 現在書き始めの論文を、ちゃんと書いて投稿する(できれば2報!) (2) 自分が代表者の科研費の研究を進捗させる(2019年はあまり何も…

Haplotype networkを作成するソフトPopART

系統地理などでよく使うハプロタイプネットワークの作成で、PopARTというソフトが使いやすい。http://popart.otago.ac.nz/documentation.shtml名前の通り、原色のpopなHPである。ネットワーク図については、minimum spaning networkやmedian joining network…

blasrのインストール(cmakeを使用する)

ずいぶん久しぶりの更新(100日振り!)。でも忘れているわけではないのです・・・ Linux(ubuntu 16.04 LTS)にblasrをインストールした。いろいろ苦戦したので、方法の簡単なメモを残しておく。 blasrについては、以前も別のコンピュータにインストールしこ…

Python3.6をインストールして切り替える

NGS解析のとき、使用するLinux (Ubuntu 16.04)でPyhton 3.6とPyhton 2.7を切り替えることがあるので、その方法についてのメモ。 pyenvを使用する。以下のサイトを参考にした。pyenvのインストールから、python3.6.0のインストールまではこちら。Python3.6.0…

MacでフォーマットしたHDDをLinux (Ubuntu12.04)でマウントする(メモ)

HDDをフォーマットするときにしばしば迷うのでメモ。MacでのHDDのフォーマット(MacOS拡張(ジャーナリング))は、Linux(Ubuntu)で普通に読み書き可能でマウントできるらしい。以下のURLによると、「MacOS拡張(ジャーナリング)」は、HFS+というフォーマ…

GATKを用いた多型サイトの抽出:-L optionについて

参考URL: https://www.broadinstitute.org/gatk/guide/article?id=4133 GATK HaplotypeCallerを使用して、リファレンスにマッピングされた特定の個人のヒトゲノムからSNPやINDELなどの多型を抽出するとき、-L optionを使用することで、計算量を節約できます…

BAM fileにRead Groupを付ける(GATKへの対応)

以下は個人的なメモ(覚え書き)になります。GATKでは、BAM fileにRead Group (@RG)が付いてないとエラーが出て解析ができないようです。でもRead Groupって何、どうやって付けるの? 何を書けばいいの? という点で疑問だったので、ちょっと勉強してみまし…