ngsdat2 icon indicating copy to clipboard operation
ngsdat2 copied to clipboard

NGS Data Analysis Textbook Version 2 (Disease Genome Analysis)

Results 30 ngsdat2 issues
Sort by recently updated
recently updated
newest added

Dry解析に関しては全くの初学者であり、この本を用いて勉強させていただいております。 以前も別の方が、p72のScripts/sort-bed.rb ccds.bed > ccds.sort0.bedに関して質問されておりましたが、その記事を参考にしてもうまく進まないのですが、Scripts/sort-bed.rb ccds.bedの部分をDiseaseGenomeValidation/Scripts/sort-bed.rbに置き換えるということでしょうか?理解が悪く申し訳ございませんが、ご教授頂けますと幸いです。どうぞよろしくお願い申し上げます。

p100のkallisto.idxの作成コマンド以下を試しましたがerrorがでました。 kallisto index --index=~/Documents/expression/ref/kallisto.idx ~/Documents/expression/ref/Homo_sapiens.GRCh38.cdna.all.fa.gz [build] loading fasta file /Users/mo/Documents/expression/ref/Homo_sapiens.GRCh38.cdna.all.fa.gz [build] k-mer length: 31 [build] warning: clipped off poly-A tail (longer than 10) from 1049 target sequences [build] warning: replaced...

コマンドが以下になっておりますが、後半の{sample}_2.fastq.gzは${sample}_2.fastq.gzと書かなければrror: file not found ../seq/{sample}_2.fastq.gzとエラーメッセジー字がでます。 cat ../seq/run_ids | while read sample; do echo processing{sample}; kallisto quant --index=../ref/kallisto.idx --output-dir=${sample} --bootstrap-samples=100 --threads=4 ../seq/${sample}_1.fastq.gz ../seq/{sample}_2.fastq.gz; done; echo finished 正しくは、以下のように書くべきなようですね。 cat ../seq/run_ids | while...

050のシェルスクリプトについてわからないことがあったので、質問させてください。 まず、{rg}で用いられているRead Groupの値というのは、どこに書かれているのでしょうか。 もう一点、samtoolsで使われている「-1」、「-」というオプションの意味についてもご教授いただければと思います。 よろしくお願いいたします。

勉強させて頂いております。 p71の "100_run-BaseRecalibrator.sh" を実行すると下記のようなメッセージが出てしまいます。 ”Try running IndexFeatureFile on the input.”とのことから、この"IndexFeatureFile"なるものが必要かと思い検索すると github(https://github.com/broadinstitute/gatk/blob/master/src/main/java/org/broadinstitute/hellbender/tools/IndexFeatureFile.java)に関連しそうな記載がございますが、これ以上進められずにおります。 ご教授いただければ幸いです。 どうぞよろしくお願い申し上げます。 ----------------------------------------------------------------------------------------------------------------------- macbook-pro:DiseaseGenomeMain t**************7$ ./100_run-BaseRecalibrator.sh Using GATK jar /Volumes/Transcend/Analysis/ngsdat2-master/DiseaseGenomeMain/gatk-4.1.9.0/gatk-package-4.1.9.0-local.jar Running: java -Dsamjdk.use_async_io_read_samtools=false -Dsamjdk.use_async_io_write_samtools=true -Dsamjdk.use_async_io_write_tribble=false -Dsamjdk.compression_level=2 -jar /Volumes/Transcend/Analysis/ngsdat2-master/DiseaseGenomeMain/gatk-4.1.9.0/gatk-package-4.1.9.0-local.jar BaseRecalibrator...

お世話になります。 220_download-ToMMo.sh実行時にファイルが1つしかダウンロードされなくて躓いています。現在原因を調べているところですが、スクリプト中で使用されているshebangについて気になったので質問させてください。 220_download-ToMMo.shより番号の若いスクリプトは全てbashを使用していますが、220_download-ToMMo.shではshに変わっています。この変更には何か意図があるのでしょうか?プログラムを見るに、複数のファイルをダウンロードするだけなので、わざわざシェルを変える必要は無いように思えるのですが。。。 今回の問題に直接は関係しないかもしれませんが、もしよろしければ教えて頂きたいです。 お忙しいところ恐縮ですが、どうぞよろしくお願い致します。

最初の赤枠6行目に関して、010_download-ucsc.shの場所が今日gitから落としたファイルだと ngsdat2-master/DiseaseGenomeMain/ に変更されていました。 そのため同赤枠5行目はcd ngsdat2-master/DiseaseGenomeMain/とする必要があります。 (2020/11/22時点)

最後の最後でうまく流れません。 ./310_run-table-annovar.shを入力すると gunzip: DRR006760.all.pass.vcf.gz: unexpected end of file gunzip: DRR006760.all.pass.vcf.gz: uncompress failed NOTICE: Finished reading 2894 lines from VCF file NOTICE: A total of 2752 locus in VCF file passed...

Sort-bed.rbがScriptsのディレクトリに入ってなかったので、githubの先生のページからsort-bed-ucsc.rbをダウンロードしてみましたが、動きませんでした。なお、UCSCからダウンロードしたときファイル名はcads.bed.gzでしたので、実際にはgunzipのあと、cads.bedで動かしています。 すみません。ケアレスミスがありました。動きました。

上記のステップで先に進めないため、上記ファイルを開いて直接コピペしたところ、 以下のメッセージが出て先に進めません。 $ #!/bin/bash $ set -euo pipefail $ bwa=bwa-0.7.17/bwa $ id=DRR006760 $ fq1=${id}_1.fastq.gz $ fq2=${id}_2.fastq.gz $ ref=RefHg38/hg38.fasta $ rg="@RG\tID:${id}\tSM:${id}\tPL:illumina\tLB:${id}" o$ ${bwa} mem \ > -R ${rg} \ > ${ref}...