ngsdat2
ngsdat2 copied to clipboard
NGS Data Analysis Textbook Version 2 (Disease Genome Analysis)
72ページの「./120_run-HaplotyppeCaller.sh」で8番染色体の途中らへんで毎回エラーが起きます。 ググってもわからないのでわかる方教えていただけませんか!? `ProgressMeter - chr8:143589342 47.5 179990 3785.9 20:16:30.694 INFO VectorLoglessPairHMM - Time spent in setup for JNI call : 1.7017637300000001 20:16:30.695 INFO PairHMM - Total compute time in PairHMM...
やたら早く終わったと思ったら以下のエラーが出てました `A fatal error has been detected by the Java Runtime Environment: SIGSEGV (0xb) at pc=0x00007f7c20e53d9a, pid=15706, tid=0x00007f7c1ef1a700` ググったら以下のURLの対応策で解決しましたのでシェアします [https://www.biostars.org/p/304286/](url)
./230_convert_35KJPNv2-snv.sh をしたところ、 No such file or directory とか、 unexpected end of file とか、 表示されましたが、 最後に complete と出たので、先に進んでいいのでしょうか? 以下です。 create tommo-3.5kjpnv2-20181105open-af_snvall.MAF.genericdb using autosome.vcf, chrX_PAR3.vcf and chrMT.vcf gunzip: Downloads/tommo-3.5kjpnv2-20181105open-af_snvall-autosome.vcf.gz: unexpected end of...
74ページの210_prep-annovar-dbsを実行したところ、 WARNING: cannot retrieve remote files automatically (by 'wget' command or by standard Net::FTP/LWP::UserAgent Perl module). Please manually download the following file, uncompress the files to annovar-hg38 directory, then add...
拝読させていただいております。 ./100_run-BaseRecalibrator.sh を実行すると、 ./100_run-BaseRecalibrator.sh: line 15: gatk-4*/gatk: No such file or directory のエラーが発生しますが対処法はありますでしょうか。 gatkは4.2.0.0をインストールし、/User/ユーザー名/に解凍した状態です。 gatk関連では、080_download-gatk-bundles.shのissueは確認し、指定していただいたファイルはダウンロードできたと思います。 ./090_prep-reference-index.shも実行し、DiseaseGenomeMain/RefHg38/hg38.dictは存在しています。 いつもありがとうございます。
75ページでアノテーション情報を付加しておりますが、*_multianno.txtをExcellでインポートしてデータをみたところ、アリル頻度情報がほとんどありませんでした。 オンラインデータベースで調べるとアリル頻度情報があるバリアントでも、*_multianno.txtファイルでは情報が付加されておりません。対応策を教えていただければと存じます。 もう一点、不具合ではないのですが、日本人データだけでなく、世界の人の頻度情報なども付加してバリアントをチェックしたいと思っているのですが、ダウンロード可能なデータベースとgenericdb形式への変換方法がわかりません。 東北メディカル・メガバンク機構以外のアノテーション情報を付加する方法、あるいは、方法を記載したサイトをご教授いただければ幸いです。 ご多用とは存じますが、以上2点につき、ご回答お願いいたします。
勉強させていただきありがとうございます。 tommoのindelのデータをgenericdb形式に変換する件ですが、例えばGATがGに変わっているバリアントの場合、スクリプトを用いて変換した後のgenericdbファイルの中身はGAT→Gとなっているのですが、annovarではAT→-に対して、annotationされるためううまくannotationされないのですが、何か対処法はございますでしょうか。 ご教授いただけましたら幸いです。
勉強させて頂いており、御礼申し上げます。 「0から始める疾患ゲノム解析 ver2」のリファレンスゲノムについて質問させて頂きます。 マッピングはUCSCからダウンロードしたhg38で行っておりますが、アノテーションで使用している東北メディカルメガバンクの日本人アリル頻度情報(3.5KJPNv2)のリファレンスゲノムはhs37d5かと思います。 このデータを用いてアノテーション情報の付加を行っている仕組み(hs37→hg38への変換?)を、スクリプトの中身を見て勉強しようとしたのですが、よく理解ができませんでした。 ご教授いただければ幸いです。 どうぞよろしくお願い申し上げます。
320_run-awk-prioritizeを実行したところ、 行 15: Scripts/awk010_ToMMo35KJPNv2.awk: 許可がありません というエラーメッセージが出ました。 私なりに調べたところ、こういったエラーメッセージが出たときはアクセス権を変更するというような情報があったので、 chmod +x をつけて実行してみたのですが、何も実行されることなく、「$」という入力待ちの状態になってしまいました。 前に質問させていただいたように、210もエラーで実行できず、それらしいファイルをDL&解凍して、annovar-hg38に入れたのですが、そこに問題があったのか、それ以降の220〜310の操作の何処かでうまく行っていない部分があるのか、とも思うのですが、判断しかねます。 ご多用とは存じますが、ご回答いただければ幸いです。
080_download-gatk-bundles.shを見ると、ftp://[email protected]/bundle/hg38からデータファイルをDLするようですが、サイトにアクセスできません。 下記サイトを見ると、Grch38/hg38 referenceはGoogleクラウドに移されたように思えます。 https://gatk.broadinstitute.org/hc/en-us/articles/360035890811-Resource-bundle そこで、サイトにアクセスしてみたところ、 Mills_and_1000G_gold_standard.indels.hg38.vcf.gz Mills_and_1000G_gold_standard.indels.hg38.vcf.gz.tbi はあったのですが、次の2つのファイルが見つかりません。 dbsnp_146.hg38.vcf.gz dbsnp_146.hg38.vcf.gz.tbi ご確認と対応方法をご教授いただければ幸いです。