Cigar issue with no M or N between two I's remains in minimap2 v2.26
Hello,
I posted on issue #392 to try to reopen it since the problem remains in minimap2 v2.26, but the issue remains closed, so I'm opening a new issue.
Here's what we're seeing:
I doubt the reference would affect this, but we're currently getting it when aligning to CHM13. It's only happening on a single sample.
See below for stack trace. This is coming from a tool we use to identify dark regions, but it's built on htsjdk. We'd really like to avoid lowering the validation stringency.
Happy to provide any files that would help debug. We're aligning one of the PacBio 1KG samples (NA19384) to CHM13
htsjdk.samtools.SAMFormatException: SAM validation error: WARNING::ADJACENT_INDEL_IN_CIGAR:Read name m64119_210621_120219/71828434/ccs, No M or N operator between pair of I operators in CIGAR
at htsjdk.samtools.SAMUtils.processValidationErrors(SAMUtils.java:458)
at htsjdk.samtools.BAMRecord.getCigar(BAMRecord.java:284)
at htsjdk.samtools.SAMRecord.isValid(SAMRecord.java:2234)
at htsjdk.samtools.BAMFileReader$BAMFileIterator.advance(BAMFileReader.java:848)
at htsjdk.samtools.BAMFileReader$BAMFileIterator.next(BAMFileReader.java:834)
at htsjdk.samtools.BAMFileReader$BAMFileIterator.next(BAMFileReader.java:802)
at htsjdk.samtools.BAMFileReader$BAMQueryFilteringIterator.advance(BAMFileReader.java:1058)
at htsjdk.samtools.BAMFileReader$BAMQueryFilteringIterator.next(BAMFileReader.java:1048)
at htsjdk.samtools.BAMFileReader$BAMQueryFilteringIterator.next(BAMFileReader.java:1012)
at htsjdk.samtools.SamReader$AssertingIterator.next(SamReader.java:591)
at htsjdk.samtools.SamReader$AssertingIterator.next(SamReader.java:570)
at htsjdk.samtools.util.PeekableIterator.advance(PeekableIterator.java:71)
at htsjdk.samtools.util.PeekableIterator.next(PeekableIterator.java:57)
at htsjdk.samtools.filter.FilteringSamIterator.getNextRecord(FilteringSamIterator.java:135)
at htsjdk.samtools.filter.FilteringSamIterator.next(FilteringSamIterator.java:108)
at htsjdk.samtools.filter.FilteringSamIterator.next(FilteringSamIterator.java:46)
at htsjdk.samtools.util.PeekableIterator.advance(PeekableIterator.java:71)
at htsjdk.samtools.util.PeekableIterator.next(PeekableIterator.java:57)
at htsjdk.samtools.util.AbstractLocusIterator.next(AbstractLocusIterator.java:312)
at htsjdk.samtools.util.AbstractLocusIterator.hasNext(AbstractLocusIterator.java:234)
at ebbertLab.drf.DarkRegionFinder.startWalkingByLocus(DarkRegionFinder.java:170)
at ebbertLab.drf.DarkRegionFinderEngine.findDarkRegions(DarkRegionFinderEngine.java:308)
at ebbertLab.drf.DarkRegionFinderEngine.main(DarkRegionFinderEngine.java:43)
Here's the command used to run minimap2:
minimap2 -a -t 20 -x map-pb -O 5,56 -E 4,1 -B 5 -z 400,50 -r 2k --eqx --secondary=no -L -Y -R @RG\tID:${TMP_DIR}\tSM:PacBio /path/to/reference/GRCh38_full_analysis_set_plus_decoy_hla.fa ./NA19384_20210630_Lee_m64119_210621_12021.ccs.fastq.gz ./NA19384_20210630_Lee_m64119_210620_030317.ccs.fastq.gz ./NA19384_20210622_Lee_m64119_210614_074737.ccs.fastq.gz
Can you help?
Thanks!
Could you give me some example sequences? Thanks!
Of course. I also added the minimap2 command used to align the sample to the original post.
Here's the offending read from the error above. I was surprised that I don't actually see two adjacent I in the cigar string. I do see adjacent I and D, though.
m64119_210621_120219/71828434/ccs 16 chr2 6229428 60 1782=1X44=1X63=1D1043=2X150=1X662=1X32=1X349=1X1822=1X2024=2X69=1X96=1X27=1X408=1X107=1X32=1X8=1X179=1X29=3I3D31=1X31=1X31=1X31=1X63=1X290=32D558= * 0 0 TGTTTCATTTGTTCTTTTGTTATTGTACTGTTACTATTTTTAGTACAATGTTGACTAGAAGTGATGATGTGAGTTAAAAAATGGAGAAGCCAATCCTCAAATTCACATGACATTGTAAGAGATCCTGAATAGCCAAAATAATCTTGAAAAAGAACAAACTTGGAGGACTCACACTACCCAATCTCAAAACTTACTACAAAGTTACAGTAACAAAGTCTATGCGGTGCTGACAGATGGATACTCACAGTTCAGTGTATTAGAATCGAAGGTGCAGAGATGAAAACACAGAACAATTGTCAACTGCTTGTTGGTGTGGGCACCAAGACATTCAATGGGGACAGAATGCCCTTTATAAAATGATACTGGAGCAATTACATAGCCACATACAAAGAATGAAGTTGGACACCTTCCTCATACAAATACAAAAATTAACACAAAATAGATGAAAAACCTAAATATAAGAGCAAAACCTTAGGAGAAAACGGTGGGTAATCTTCATGACCTAGGATTTGGCAAAGACTTTTAGGATGTGACACCAAAGGCATGAAAACAACAAAAATAGATAAATTGGACTTCATCAAAATATAAAGCTTTTATGCTTCAAAGGACGCCATCAAGAACATTGAAAAAAAAAACCTTACAACTCACAGAATGGGATAAAATATCTGCAAATTACATATCTAATAAGCATCTAGTATCCAGAATAATAAGGAACTCTTACAACAAAGCAATAAAAAGACAAATACCCAATTAGAAATGGGCAAAGGATTAGAGTAATAGTGTCTCAAAAGAAGATACACAAATGGCCAACAGCCATGTAAAACTATGCTCAACACCATCAGTCATTAGGGACACGCACATCAAAGCCATAATTAAATTCCACCTACACACAAAGGTGGCTGAAATTGAAAAGGGGGACAATAACAAGTGCTGGCAATAACATGAAGAAATTAGTACCCGTGTCCATTCCTGGTGGGAGAGGAAACAGTGTAGCCACTTTGGAAATGTTTGGTAGCACTTCAAAAAATCGAACGTATTTTACTGAGCAGCTCCCTTCCTTGGTATGAACTCAAAAGATTTGAAAACGTATGTTCTTCCCAAACCTTAGTCATAAATGTTCACAGCAGTGTTATCTATATAAACAAAAGATGGAAACAATGCACACTCGCATCAGCTGATGAATGAAATAACATAGATGGTGAAACAGTAAAATAGAATACTAATTAGCCATAAAAGGAGCAATGTTCTGATAAATACTACAATGCAGGTGCAAACAGGGTGCTAAGTGAAAGAAGCCAGACACAGAAGGTTGTATATCATATGATTCCACGTATATTAAATTTCCAGTATAGCTGAATCTATAGAGAAAGAAAGTGGATTAGGGTTTGCCAGGAGCTGAGAGGAAGGGCAAATCCTTGCTAATAGGATCATTGGCAAGGGTAGAATGATTGCTAATAGGTAGAAAGTGTATTTTTGTGTTGAGAAAATATCCTGGAAATAGTAGTGATGGTTGCACAACTTTGTTGTTATAATACAAAATATCAAATTGTTTGATTTAAAATGGTGAGTTTCGTGGCATATAAATTATATGTCAATAAAAATGTAACTTTGGCCGGGCACGGTGGCTCACGCCTGTAATCCAGAACTTTGGGAGGCCGAGGCACATGGATCATGTGAGGTTAGGAGTTCGAGACCAGCCTGGCCAACATGGCAAAACCCTGTCTCTACTAAGAATACACAAAATTGGTCTGGTGTGGTAGCTGGCGCCTGTAATTCCAACTACTTGGGAGGCTGAGGCAGGAGAATTGCTTGAACCCAGGAGACAGAAGTTGCAGTGAGCCGAGATTGCGCTATTGCACCACTCCAGCCTGGGTGACAGAGCAAGACTGTCAAAAAAAAAGTTATCTTTAATGTTCACTGACTAACACTCCCAAGACTGGCATTCCTGCGCTGTGGGTATCGTTCCTGCACAAGTGACTCAGAGGATGCATTGTTTTCCCATCTGTGGCTCTGAACTCTCTTTGGTCATCAAAATTGTTTATGTCCAGCTAGTTGAAGAGGAAGATTGTGAAGGAAAAAATATCAATTCTCTAAAAAAAAAAATCCTTCCTTTTGAAGCAAACTACATCATACCTCTTCGTAAGATGGAATTTCACGGCAATGCCTATATGAGACAGGTGCTAGATGATGTATTTCCTTACTGGGAAGGTACTTCTCAGTGATAATTGGTTATTGTTTGGACAGGGGATTTATGAGCTAAATTGTGCTTCCCCCAGATTCTGTATGTTGAAGCCTTAGCATAGAGTACATCAGAATGCAACTGCCTTTAAAGATTGGGCCATTGAAAAGGTGACTAAGACTCAATCTGACTGGAAGTGGCAAGACCCAAGGGAACATGCCCATCCATGGAGGAGAGGCCAGGTGAGAACACAGCAAGAGGGTGAGTGGCTTCAAGCCACAGCAAGAGGCCTGGAGAGAGACTGCACCTGCTGATAACCTGATCTTGAACTTCCAGCCTCCAGCATGGTGAGACAAATAATTTTTTTAAACCACCTGATCAGTGCTTCTTTGTTATTGAAAGCCCTAGCAAAGTAATACAAATGGAGGGATGCAATTTGGCATACATTTATTCACTTCTGTCACACTCCACGTTCTGCTGACCTGTAAGCTAAAGGAAAATGTGTCTGTCCCCCTCATCAATGGTGGAAGAGCTACAGGAAAAACAAAATAAAATCCCTTCACCCCATTTATAAAATGGAAGAAGAGGAAACACAGCAACAACCCATCCCTAGCAGTTTGGGCAGCTGCCCTCATCCTAGCAGTAGGGGAACTTTCTCAATTATGTCCTCATTCTGCTTCCTTGCAGTGACTCTCTCGCCTCCTTTCCTCTGTGCTCTCTGGGAGATTGTCTTCTATGATCATATCCACAGCAGGCATCTGGGAGCTTACCCTTCTTCGGGTTTGCACAAATTTCACAGGCAACTTCACACTGGCGGGATTTGGGAGAGTGAAAGGGTGATTTTACTGTCAAAGATTCTTAAGCCTACAGTAATAGTTTCTTTGGAAATAAAATTTTCTAAGAAATAGGTAGGCTTTTAATCTACTTGACGCTAGTTAGTTCCATGTGTCAGTATTTAAAGTTTATTACGAGACTGGGTTCTCACACCTGCTTTACATTTGCCCCTTCTTTGCCTAAGCTGATCTCTTCCACACTAATGGTGGCTACCTTTGAGACTGTTGAAAAAATAGGCTTAGGAAGGAGCTATCTTTCTGAACCTAACATTTGCTTATTTATTGAGTCCTTCTGTTGAACTACAGTTTTTAAGTTTTTGTCTTGTTTTAGTTACTCAAAATCATTTTGAATTTAATCCCTTTCTTTCTAGTGTCTGGAAGTTCTTGCCTCTTCTCACCCTTCAAAGCTCCATATCTTGACTTTCTACTTGCTTCTGTTTCTAACGAGTGATTCTTATCCAAATTCACCCATATTATAATATCTTGGTGCTCTCTGCAAGCGAAAGAGAACTCAAAGTAACACTCTGGTCCTTCCTGGCCACTTCCCTTAGAGTGGTGTGAATTTTTGTGGACATTCAACTCTGCTGCCACAGACACAAAATCCCAAACTGAAGAACAGCAATAACTAGGGTTCCTCTGCAAAAGAAAGAGGCTTAATTGACTCATAGTTCAGCAGAGCTGGAGGGGGAGGCCTCAGGGAAGTTACAGTCATGGCAGAAGGCAAAGGAGAAGCAGGCGTCTTCTTCTCAGGGTGGCAGGACTGAGTGAGTTCAAGCAGGGGAAATGCCAGAAGTTTATAAAACCATCAGATCTCATGAGACTCACTCACTAGCATGAGTACAGCATGGGGGAACTGCCCCCATGATCAATTACCTCCACCTGGTCCTGCCTTTGACACATGGGGATGACAACAAGTCAAGATGAGATTTGGGTGGGGACACATAGCCAAACCATATCAATGTGTATATATTTCTGTATTTAAAATATACTTACATGTGATAATAAATAATATATTTATATTTATCATATATTTTATACATATAAAATATACATTTATATACATACACATATACATAGATGTGTGGATATGACTGTGTGTATATGTGTGTACTATATTTCCTCAAAATACTTATCATTGAGTAGATAAATCATTTTTTTTTCAATGATACAACTGAATAGCCATAACAAGGAACAGAGAATTCAGATTCAGGAACAAAATGTAAACAGCATGTTCATAGAGTGTGAGACATTGAGAGTTTCTCATTGCAGGACTTGCAGCCAGTTTTTCTGAATCTGTGTCCACTTCTCTTTTCACTATCACGTATTGAGCTTAGAGCCAGCCCAGCAAGCAGAGAAAGTACAACATGGACTTTCCACAAGCACAGGTTTCCAAGAGTGATTTCCTCCAGGACTACTAACAAGGAAGAGAAATTTCTGAAGCCCTCAGTCCTGAATTTGGAGAGCTCTACCCCTGCAAGAAAATGCCTGTTAACATAGCTCTGCTGGGTATAAAAAGAATTTTATTTTGGATGGCAGTTGGCTATTTTATTCCCTGAATCCTCAGTCTGACTCTATTTCATGGGGTGTCGACTCTGTCTGTGATTACTCCAATGTTCAGGTGCAGAGAAGTCAATGTTTATGAAAGTGATGTCCCTGTCAGTAGCAAGCATATCATCTGGCCCCCCGAGCTGTCAAAGAACAGATTGTAGAATTACCATTAGAATACAGGAGTTTATAGCTGCAGGCAGTAAGTGCAGAGCCGGTAAGCATATGTCCCCAGCATGATATTTTAGCTTCATATGAAGCCGTAAAGTGGAAATAAGCCAACAGTACAGCAGCAACTGCTAACTGTTCTGTCTCTCCATGTTTCCACATTGTGCCATATGTCTGGGTAATTCTCAGTAAAGGGGGCATTACTGTCTCTCAGCTGACTGAGAACATTTCCCAAAAGGGCTCAAAAAATTGGTGCGAGACTATGGTCACAATGACCTCACCTACTTTTATTGTCCAGCTGGCCTCATGGATTTTTCATTTAACTCTGGTAGAGACGTGGATCCTCTCTCAGCATTGATTAATTATGGTGAGAAAGTGAAAACTTTCTTAGAGTGAAAAAAAAAGTTCTTGAGTCTTCCAGATGTCCGTGTCTAGATGGTTAATATTTGCTCCAAAGGTTGAATAGGATTTTATAAAAGGAAAGCAAGAGATCTTTACATTATTCTTGAAGTGATATCAGTTTTTTTAAAATACAAAAATAACTAATTAATGCTAGCCTAATTAGCATCCAAAAATATGAACCATACATTATTTCAGGAAAGACAAAACTGCCTCCTGTGGATCCAAATCAGGAGGGATTCTATGCAGTTGGAAGAAGAGAGGCTTTGGAATGAGGGATATGGATTCTGTTTTCCACTTTGCCAGTTATAAACCGTGACCTTCATCAAGAGTTCAAACTCCTAGAGTCTTTGCTTTCTCAAGTGTAAAGAGATGCTAGTAAGTTGCAGGGGTGTGCATACATTTTCCCAAGGAGCTCATAAGAAGTGCCTATCACGATGAATTTCACACAACAGGGACCCCATACATGTTAGTGACCGTCCTGCTCAGCTCTGGATGAAGTCAGATTTAATCTTAAGATTGGAGAATAAGGCAGAGACTATTATCTCAATTTATGAGTCAAAAAACTGAATTTCAAAGAGATTAATTAAACTTCTCCATATTTTATTTTAGAGGAAAATGCTTAGACTTAAACCCAGGACCCTATAATTTCAAATCCCATGCTAATTTCACTACGACATGATGCCTTGTGAAAATAATGAAGCAAATTCTCTTTCCTATGAACTAAAGTTTTCAGTACTAAAAGTTTCATAGTTCTTGTATTCCACACATTTTTGAACTGATATTTATTTTTGGCAGTATGACCCATGCATATGCCTAGTATATGATTTCTGTAATTTTTATCAATGACATATTCATCTAAAATTATGACAGCTAAAGGTATTTATGTAAACTACACAAATAAATGTGATATTCATAGGGCTTTCCTTGGAATCATAAACTATAAGGAATTAATGACATGAGTGTTAGTACTGAGCTGCACCAGCCCCTCTGTTTAGCAGGACTAAACTATATTAGCCGAATGCTCCACCTGTGTGTAAAAATATCTTTCAATGGGCATCACTTTAAAAACAGATGCTATTTTGTGAAACAATCTCATATAAAACCTCAATACAGTTAATATCTTTCAGAACTGTCTAAATGTCTTTTATTAAAAATGCATTCCTGGCCTCTCTGAGTCCATGTGCTCATCTGTTGGAATGCAAATGAACACTTCTACTGTTGTAGAGTTCTTTATCTGTCACACAGACCCATGTGCCATCCACAGCCTCCCCACTCCCATGAAGGCAGGTGGTTTCTGTGTCCAGATTCAGCCAATGGGCTTTGAGTGGAAGTAAAGTGTGTCACCTCCATGTAGATGTTCAACAAAAAGTAGCTTAATAACAATGCTAATAACCGTACAATAACATTAACAGTGGTATGTATTAATTTCCAATCAGATCTTGATTTACTTTTCCTGGTATCTGATTGGCTTATAGAGACTTTTGCCACAGTGTTCTTTCTACTTTTCCTACCTTCAGTTTTCTTCATCCTTCCTTTATGCTTTTCAAAAAAAATTTCTTTCATCTAAAGCATGTTTGTTTACATTTAAGGCCCCTCTCAACGTGACCCTAACTACTGCTCCAGAATCATGGATTTTCTTAGTTCTCAATCTTACCAATGAATATTCATTTCCTGTTATATACATCAGCCACCTGGATTCCTGATCTTTTCTGAACAGCAGTGGCTTTTGCACAACGTCACACCTTTGCAAATTGTGTTATCCTCACTGAAGCGTCCTTGACATGTCCTCACAGTCACCAGATCTGAGAGCCTGACTCCGAGGGCTCTCTGGGGTCTGTGATTTGTTCTGCTGGATGATGGCACCCACAGGGTTCCGTCTGAGACACAGGTCAGAAGTGCACTCTCCCGGAATGCGTAGACTAAGTTACAGCAAAAGTAAACAGTACTGAAGCAGCTCAAGAGGGCATCTAATTGAATTATGCCAATGATTAAGTGCTCTAAATATCTATTCAATCATCTTGCCTCTACCCAGATGAGATAAAAGAATCAAGCAGGAATTATTAGAAAGGAAGAAAAATAAACTCACACTACAAATGCTGGGAGAAACTTTTTGATAGAGAAGCATAAATGAATGAAATGTCCCCCAAGAAGGCAGAGGAGCAGCACAGAAATCAAATCAGGTGGTGCTGGGCCACGATGGAAGAGAACTGGGTCAGGGAGGGAGGCCCCTGGTGTGTCACTCACCTCTCACCCTCCACTTAGCACCTCATGTCCAGAGGAGAGTGCTGTCTGCAGTCACGTCCTTCAATCTGCACATTTATTTTGGGTCTAAAGTCGATGCTTCTTTATTTCCTTTTTGTCTTTCACGTTGAGATTTTCCTCCTGTATCTCTTTGGATTGATACTGTTGGGGTAGTACAAAAAAATGCAGACTTTCCTGGTTAGGCCAGCCTTGGTTCCAATCCAGCTCAGTCCTTTTTAGCTTGTGGTCTTGGAAGGGTTACTTTGTCTTTCAATCCTCTGCAGCTTGGAGACTGGAATCCCAATCACAAAATGCTGCTTATTTATTTATTCAATTGATTATTTGCTCATTCAAGTAGTTGAGCTCTGATTGTCTGACAAACCTTGGGCTAGTTGCTAGGATTGAGACAATGGGCAAAATGTCAAGACCCTTCTCCTGGGATCTTCCAGTCCAGTGGAGCATGAAATAAAATCATGTGTAGGCAATGTCCACCTCAGTGCCTGGAATATAGTAAGTGCTCAGTAAACGGGACAGTGGCTCCTGTCCTCTTTCTTTTCTTATCCTTCTCACACACTCTTCTGTGCCTCTGTCCTCCAGCCCCCCCAGGGATTCTGACAACAAAGGTTTCTAATTTCTTTCCCAGCTTAGAGTATTGAGACAAGATTTGGATGAGCAGCCAAACGGAGAATTTCTCCTGGGAAACTTCAGCAACTTGATGCAGCTGCTGAGCAGAGGCCTCATTTTACGGGACCTCGTTGTCATCCCATGCACTGCATCAGCAGCGATTCAGAGCCTCGCTGGAAGGAGCGACAGGACAAAGGAAAAGACAGGGTTCGCACAACACAGAAGCAACGATATCCCCAGAAAATAAACCAACAAAACTAAACCCCAAAACCTCCCTTCCATTAACAGAGCCACTTAGAATATTAAAGGTTTATACGTCAAATGGCATCTTTTGATCCCTACAAGACAAAGATGTTACTTTTATGATCCCCACTTTACAAGATGTGGCTCAGAGAGGATGAGAATTTATCCAACTGGTTCAGTCAAGGTTTATTTTGCTTTCTTTCCTAAAAAAAAAAAATCCTGCAATAGACACTAACTATGGCTGGTTTAAGCAGAAGATAAGCTGATTGAAAGGACATCAGTCCATCACAGAACTGTCAGGTGGCCCAAACCAGCAGTGTCAAGGTTACGCATTAAGAATCAAACCCCTACCCACGCCCCACTACGGGAAGCAGATGCCCACCTCCTGCCCCACAGTGGGCACTACTGGAGCGTATGTAGCAGGACCATGACCTCAAGGGAACTGCTACCTCCACCGCCACAGTGAACAGTGAGACTGTACCTCCACCGCCACAGTGAACAGTGACGCTGTACCTCCACCGCCGCAGTGAACGGTGACGCTGTACCTCCACCGCCGCAGTGAACGGTGACGCTGTACCTCCACCGCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACTTCCACTGCTACAGTGAATAGGGACACTGTGCGCCATCTCAGGGCAGAGGAAAGGGGAGAACCAGTGACCTTCTTCCTCTCTGAGTGTCTGTCTCTCATTGCCACCCATGCAGAAGGGACTCCCTTAAACACAAGGAGAAGTTCCTGATGCTGGATGACAAGGCAATGACAGATACCCAGTAAAACCAAGTCCATGCGGCCTCAATGGGAAGAGCTCATTCTGAAAATGTAGTTCCAATTTCTAATTCAGTCCTCTTTCCACTATACTACTTTGCATAATAAGCAACAGGTGTTGGAATATGACCCTCTTCTCATGACTGTTGTTGTTATCATAAAACAAAACCTTCTACCATTACTTAGTCTTTTATCATTTACAAAGAAATCCCTTTTTAGTGACCTTTATAACCACCCTGAGAGGGAAGCAGGCAAGTAAATAACTCTATTTTCTTTTCTTCTTTATTTTTTCTGATAACAAAATGTCTAAAGAAGCACCTGGTACTTATGTAATCAAAGCACTTCCAATACTGAAACAAAAC ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~e~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~P~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~h~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~y~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~i~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~q~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~^~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~}~~~~~~g~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~q~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~}~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~>~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~t~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~V~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~`~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~t~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~k~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~t~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~m~r~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~y~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~>~~~~~~~~~~~~~T~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~\~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~z~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~z~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~Y~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~n~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~i~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~x~~~~~~~V~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~p~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~m~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~L~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~N~~~j~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~}~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~k~~~~~~~~~~~`~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~r~~~~~~~~~~y~~~~~~~~~~~~~~~~~~~~b~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~f~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~T~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~t~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~R~~~~~~~~~~~~~~~~~~~~~~~C~~~~~~~~~~~~~~~~ RG:Z:${TMP_DIR} NM:i:63 ms:i:19626 AS:i:19671 nn:i:0 tp:A:P cm:i:1182 s1:i:9621 s2:i:635 de:f:0.0028 rl:i:458
@mebbert Excuse me, did you find a solution to this problem?
Hello @quanc1989: we haven't heard anything back about a fix on the issue. Are you seeing it too?
To get around it, we lowered validation stringency for this sample. We don't like doing that, but it shouldn't be a problem.
Thank you @mebbert . I also encountered this error when aligning to CHM13 v2. I also suspect that the reference affects this error. I will try to lower validation stringency for PICARD. Thanks a lot.
Hi mebbert and quanc1989, I also got same error from picard. I used minimap2 v2.26 and aligned to CHM13 v2. I tried with same sample aligned to hg38 and it was successfully completed without lowering the validation stringency for picard. @quanc1989 your suspect for the reference effect seems correct but I don't know why
Thanks @AsmaaSamyMohamedMahmoud and @quanc1989!
Interesting to see that the reference does matter.
2024, I'm with you I have
No M or N operator between pair of I operators in CIGAR No M or N operator between pair of D operators in CIGAR
on ONT reads after minimap2 on hg38 in dorado basecalling [email protected] at 5% of my samples However they are using minimap2-2.25 (r1173) fork (but no such fixes decaried in 2.26, so...) I could provide reads if it would be usefull
Next I gonna test CHM13 v2
Hi everyone,
I've run into a similar issue with this thread as well. So in my case I used minimap2(v2.26) and bwa, but also I wanted to mark and remove the duplicate reads using sambamba markdup or PICARD MarkDuplicates.
1)
In the first scenario using BWA and sambamba everything worked smoothly, identifying the duplicates and then removing them successfully. However, I used the same reference genome but from the ENA browser.
2)
When using minimap2 with sambamba and a same reference from RefSeq I encountered this error:
[W::bam_hdr_read] EOF marker is absent. The input is probably truncated
I did check the BAM files and SAMfiles with quickcheck and everything seemed okay to me.
Then I found another thread that tries to fix the sambamba issue since I was thinking this is a sambamba problem. So, using this time dev sambamba markdup /dev/stdin . However, this gave me this error:
sambamba-markdup: not enough data in stream
3)
So then I decided to use PICARD instead as alternative, and then this brought me to this thread, because I had the following error:
Exception in thread "main" htsjdk.samtools.SAMFormatException: SAM validation error: WARNING::ADJACENT_INDEL_IN_CIGAR:Read name m84128_231104_112949_s2/253035149/ccs, No M or N operator between pair of I operators in CIGAR
at htsjdk.samtools.SAMUtils.processValidationErrors(SAMUtils.java:457)
at htsjdk.samtools.BAMRecord.getCigar(BAMRecord.java:284)
at htsjdk.samtools.SAMRecord.isValid(SAMRecord.java:2103)
at htsjdk.samtools.BAMFileReader$BAMFileIterator.advance(BAMFileReader.java:848)
at htsjdk.samtools.BAMFileReader$BAMFileIterator.next(BAMFileReader.java:834)
at htsjdk.samtools.BAMFileReader$BAMFileIterator.next(BAMFileReader.java:802)
at htsjdk.samtools.SamReader$AssertingIterator.next(SamReader.java:574)
at htsjdk.samtools.SamReader$AssertingIterator.next(SamReader.java:553)
at picard.sam.markduplicates.MarkDuplicates.buildSortedReadEndLists(MarkDuplicates.java:524)
at picard.sam.markduplicates.MarkDuplicates.doWork(MarkDuplicates.java:257)
at picard.cmdline.CommandLineProgram.instanceMain(CommandLineProgram.java:305)
at picard.cmdline.PicardCommandLine.instanceMain(PicardCommandLine.java:103)
at picard.cmdline.PicardCommandLine.main(PicardCommandLine.java:113)
To sum up, I think the problem might have something to do with minimap2, but I'm not entirely sure what it is. Did someone have already found any solution?
Thanks