maximum-likelihood-relatedness-estimation
maximum-likelihood-relatedness-estimation copied to clipboard
What fields are required on the VCF file?
Hi, My VCF file has the PL field. I am trying to format the missing value to use this file as input.
The original file looks like
Chr01 11582413 . C T 1 PASS AC=5;AF=0.625;AN=8;CIGAR=1X;DP=116;GTI=0;LEN=1;NUMALT=1;PAO=0;PQA=0;PQR=0;PRO=0;RUN=1;TYPE=snp;technology.illumina=0 GT:AO:DP:PL:QA:QR:RO . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . 0/0:0:4:0,12,116:0:125:4 1/1:6:7:172,18,0:242:0:0 1/1:1:1:40,3,0:40:0:0
0/1:10:17:308,0,189:395:263:7
the I tried reformatting to this but it failed
Chr01 11582413 . C T 1 PASS AC=5;AF=0.625;AN=8;CIGAR=1X;DP=116;GTI=0;LEN=1;NUMALT=1;PAO=0;PQA=0;PQR=0;PRO=0;RUN=1;TYPE=snp;technology.illumina=0 GT:AO:DP:PL:QA:QR:RO .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:.
.:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:.
.:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. .:.:.:.:.:.:. 0/0:0:4:0,12,116:0:125:4 1/1:6:7:172,18,0:242:0:0 1/1:1:1:40,3,0:40:0:0 0/1:10:17:308,0,189:395:263:7
After looking at some of your example files I reformatted to this
Chr01 11582413 . C T 1 PASS AC=5;AF=0.625;AN=8;CIGAR=1X;DP=116;GTI=0;LEN=1;NUMALT=1;PAO=0;PQA=0;PQR=0;PRO=0;RUN=1;TYPE=snp;technology.illumina=0 GT:AO:DP:PL:QA:QR:RO ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0
./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 ./.:0:0:-9.0,-9.0,-9.0:0:0:0 0/0:0:4:0,12,116:0:125:4 1/1:6:7:172,18,0:242:0:0 1/1:1:1:40,3,0:40:0:0 0/1:10:17:308,0,189:395:263:7
So the original was ./.
or .
and .:.:.:.:.:.:.
and ./.:0:0:-9.0,-9.0,-9.0:0:0:0
failed with error.
1 - How should I format the genotype information on this vcf file (GT:AO:DP:PL:QA:QR:RO)? 2 - What is the ML field you have on your vcf files? 3 - should I strip out my vcf to leave only with the GT:PL fields?
Thanks in advance