maximum-likelihood-relatedness-estimation icon indicating copy to clipboard operation
maximum-likelihood-relatedness-estimation copied to clipboard

What fields are required on the VCF file?

Open inti opened this issue 7 years ago • 5 comments

Hi, My VCF file has the PL field. I am trying to format the missing value to use this file as input.

The original file looks like

Chr01   11582413        .       C       T       1       PASS    AC=5;AF=0.625;AN=8;CIGAR=1X;DP=116;GTI=0;LEN=1;NUMALT=1;PAO=0;PQA=0;PQR=0;PRO=0;RUN=1;TYPE=snp;technology.illumina=0 GT:AO:DP:PL:QA:QR:RO    .       .       .       .       .       .       .       .       .       .       .       .       .       .   .
        .       .       .       .       .       .       .       .       .       .       .       .       .       .       .       .       .       .       .   .
        .       .       .       .       .       .       .       .       0/0:0:4:0,12,116:0:125:4        1/1:6:7:172,18,0:242:0:0        1/1:1:1:40,3,0:40:0:0
        0/1:10:17:308,0,189:395:263:7

the I tried reformatting to this but it failed

Chr01   11582413        .       C       T       1       PASS    AC=5;AF=0.625;AN=8;CIGAR=1X;DP=116;GTI=0;LEN=1;NUMALT=1;PAO=0;PQA=0;PQR=0;PRO=0;RUN=1;TYPE=snp;technology.illumina=0 GT:AO:DP:PL:QA:QR:RO    .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.
        .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.        .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.
        .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.        .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   .:.:.:.:.:.:.   0/0:0:4:0,12,116:0:125:4    1/1:6:7:172,18,0:242:0:0 1/1:1:1:40,3,0:40:0:0   0/1:10:17:308,0,189:395:263:7

After looking at some of your example files I reformatted to this

Chr01   11582413        .       C       T       1       PASS    AC=5;AF=0.625;AN=8;CIGAR=1X;DP=116;GTI=0;LEN=1;NUMALT=1;PAO=0;PQA=0;PQR=0;PRO=0;RUN=1;TYPE=snp;technology.illumina=0    GT:AO:DP:PL:QA:QR:RO    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0
    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    ./.:0:0:-9.0,-9.0,-9.0:0:0:0    0/0:0:4:0,12,116:0:125:4        1/1:6:7:172,18,0:242:0:0        1/1:1:1:40,3,0:40:0:0   0/1:10:17:308,0,189:395:263:7

So the original was ./. or . and .:.:.:.:.:.:. and ./.:0:0:-9.0,-9.0,-9.0:0:0:0 failed with error.

1 - How should I format the genotype information on this vcf file (GT:AO:DP:PL:QA:QR:RO)? 2 - What is the ML field you have on your vcf files? 3 - should I strip out my vcf to leave only with the GT:PL fields?

Thanks in advance

inti avatar Sep 06 '16 13:09 inti