minimap2 icon indicating copy to clipboard operation
minimap2 copied to clipboard

Cigar issue with no M or N between two I's remains in minimap2 v2.26

Open mebbert opened this issue 2 years ago • 9 comments

Hello,

I posted on issue #392 to try to reopen it since the problem remains in minimap2 v2.26, but the issue remains closed, so I'm opening a new issue.

Here's what we're seeing:

I doubt the reference would affect this, but we're currently getting it when aligning to CHM13. It's only happening on a single sample.

See below for stack trace. This is coming from a tool we use to identify dark regions, but it's built on htsjdk. We'd really like to avoid lowering the validation stringency.

Happy to provide any files that would help debug. We're aligning one of the PacBio 1KG samples (NA19384) to CHM13

htsjdk.samtools.SAMFormatException: SAM validation error: WARNING::ADJACENT_INDEL_IN_CIGAR:Read name m64119_210621_120219/71828434/ccs, No M or N operator between pair of I operators in CIGAR
    at htsjdk.samtools.SAMUtils.processValidationErrors(SAMUtils.java:458)
    at htsjdk.samtools.BAMRecord.getCigar(BAMRecord.java:284)
    at htsjdk.samtools.SAMRecord.isValid(SAMRecord.java:2234)
    at htsjdk.samtools.BAMFileReader$BAMFileIterator.advance(BAMFileReader.java:848)
    at htsjdk.samtools.BAMFileReader$BAMFileIterator.next(BAMFileReader.java:834)
    at htsjdk.samtools.BAMFileReader$BAMFileIterator.next(BAMFileReader.java:802)
    at htsjdk.samtools.BAMFileReader$BAMQueryFilteringIterator.advance(BAMFileReader.java:1058)
    at htsjdk.samtools.BAMFileReader$BAMQueryFilteringIterator.next(BAMFileReader.java:1048)
    at htsjdk.samtools.BAMFileReader$BAMQueryFilteringIterator.next(BAMFileReader.java:1012)
    at htsjdk.samtools.SamReader$AssertingIterator.next(SamReader.java:591)
    at htsjdk.samtools.SamReader$AssertingIterator.next(SamReader.java:570)
    at htsjdk.samtools.util.PeekableIterator.advance(PeekableIterator.java:71)
    at htsjdk.samtools.util.PeekableIterator.next(PeekableIterator.java:57)
    at htsjdk.samtools.filter.FilteringSamIterator.getNextRecord(FilteringSamIterator.java:135)
    at htsjdk.samtools.filter.FilteringSamIterator.next(FilteringSamIterator.java:108)
    at htsjdk.samtools.filter.FilteringSamIterator.next(FilteringSamIterator.java:46)
    at htsjdk.samtools.util.PeekableIterator.advance(PeekableIterator.java:71)
    at htsjdk.samtools.util.PeekableIterator.next(PeekableIterator.java:57)
    at htsjdk.samtools.util.AbstractLocusIterator.next(AbstractLocusIterator.java:312)
    at htsjdk.samtools.util.AbstractLocusIterator.hasNext(AbstractLocusIterator.java:234)
    at ebbertLab.drf.DarkRegionFinder.startWalkingByLocus(DarkRegionFinder.java:170)
    at ebbertLab.drf.DarkRegionFinderEngine.findDarkRegions(DarkRegionFinderEngine.java:308)
    at ebbertLab.drf.DarkRegionFinderEngine.main(DarkRegionFinderEngine.java:43)

Here's the command used to run minimap2:

minimap2 -a -t 20 -x map-pb -O 5,56 -E 4,1 -B 5 -z 400,50 -r 2k --eqx --secondary=no -L -Y -R @RG\tID:${TMP_DIR}\tSM:PacBio /path/to/reference/GRCh38_full_analysis_set_plus_decoy_hla.fa ./NA19384_20210630_Lee_m64119_210621_12021.ccs.fastq.gz ./NA19384_20210630_Lee_m64119_210620_030317.ccs.fastq.gz ./NA19384_20210622_Lee_m64119_210614_074737.ccs.fastq.gz

Can you help?

Thanks!

mebbert avatar Jul 26 '23 15:07 mebbert

Could you give me some example sequences? Thanks!

lh3 avatar Jul 26 '23 16:07 lh3

Of course. I also added the minimap2 command used to align the sample to the original post.

Here's the offending read from the error above. I was surprised that I don't actually see two adjacent I in the cigar string. I do see adjacent I and D, though.

m64119_210621_120219/71828434/ccs	16	chr2	6229428	60	1782=1X44=1X63=1D1043=2X150=1X662=1X32=1X349=1X1822=1X2024=2X69=1X96=1X27=1X408=1X107=1X32=1X8=1X179=1X29=3I3D31=1X31=1X31=1X31=1X63=1X290=32D558=	*	0	0	TGTTTCATTTGTTCTTTTGTTATTGTACTGTTACTATTTTTAGTACAATGTTGACTAGAAGTGATGATGTGAGTTAAAAAATGGAGAAGCCAATCCTCAAATTCACATGACATTGTAAGAGATCCTGAATAGCCAAAATAATCTTGAAAAAGAACAAACTTGGAGGACTCACACTACCCAATCTCAAAACTTACTACAAAGTTACAGTAACAAAGTCTATGCGGTGCTGACAGATGGATACTCACAGTTCAGTGTATTAGAATCGAAGGTGCAGAGATGAAAACACAGAACAATTGTCAACTGCTTGTTGGTGTGGGCACCAAGACATTCAATGGGGACAGAATGCCCTTTATAAAATGATACTGGAGCAATTACATAGCCACATACAAAGAATGAAGTTGGACACCTTCCTCATACAAATACAAAAATTAACACAAAATAGATGAAAAACCTAAATATAAGAGCAAAACCTTAGGAGAAAACGGTGGGTAATCTTCATGACCTAGGATTTGGCAAAGACTTTTAGGATGTGACACCAAAGGCATGAAAACAACAAAAATAGATAAATTGGACTTCATCAAAATATAAAGCTTTTATGCTTCAAAGGACGCCATCAAGAACATTGAAAAAAAAAACCTTACAACTCACAGAATGGGATAAAATATCTGCAAATTACATATCTAATAAGCATCTAGTATCCAGAATAATAAGGAACTCTTACAACAAAGCAATAAAAAGACAAATACCCAATTAGAAATGGGCAAAGGATTAGAGTAATAGTGTCTCAAAAGAAGATACACAAATGGCCAACAGCCATGTAAAACTATGCTCAACACCATCAGTCATTAGGGACACGCACATCAAAGCCATAATTAAATTCCACCTACACACAAAGGTGGCTGAAATTGAAAAGGGGGACAATAACAAGTGCTGGCAATAACATGAAGAAATTAGTACCCGTGTCCATTCCTGGTGGGAGAGGAAACAGTGTAGCCACTTTGGAAATGTTTGGTAGCACTTCAAAAAATCGAACGTATTTTACTGAGCAGCTCCCTTCCTTGGTATGAACTCAAAAGATTTGAAAACGTATGTTCTTCCCAAACCTTAGTCATAAATGTTCACAGCAGTGTTATCTATATAAACAAAAGATGGAAACAATGCACACTCGCATCAGCTGATGAATGAAATAACATAGATGGTGAAACAGTAAAATAGAATACTAATTAGCCATAAAAGGAGCAATGTTCTGATAAATACTACAATGCAGGTGCAAACAGGGTGCTAAGTGAAAGAAGCCAGACACAGAAGGTTGTATATCATATGATTCCACGTATATTAAATTTCCAGTATAGCTGAATCTATAGAGAAAGAAAGTGGATTAGGGTTTGCCAGGAGCTGAGAGGAAGGGCAAATCCTTGCTAATAGGATCATTGGCAAGGGTAGAATGATTGCTAATAGGTAGAAAGTGTATTTTTGTGTTGAGAAAATATCCTGGAAATAGTAGTGATGGTTGCACAACTTTGTTGTTATAATACAAAATATCAAATTGTTTGATTTAAAATGGTGAGTTTCGTGGCATATAAATTATATGTCAATAAAAATGTAACTTTGGCCGGGCACGGTGGCTCACGCCTGTAATCCAGAACTTTGGGAGGCCGAGGCACATGGATCATGTGAGGTTAGGAGTTCGAGACCAGCCTGGCCAACATGGCAAAACCCTGTCTCTACTAAGAATACACAAAATTGGTCTGGTGTGGTAGCTGGCGCCTGTAATTCCAACTACTTGGGAGGCTGAGGCAGGAGAATTGCTTGAACCCAGGAGACAGAAGTTGCAGTGAGCCGAGATTGCGCTATTGCACCACTCCAGCCTGGGTGACAGAGCAAGACTGTCAAAAAAAAAGTTATCTTTAATGTTCACTGACTAACACTCCCAAGACTGGCATTCCTGCGCTGTGGGTATCGTTCCTGCACAAGTGACTCAGAGGATGCATTGTTTTCCCATCTGTGGCTCTGAACTCTCTTTGGTCATCAAAATTGTTTATGTCCAGCTAGTTGAAGAGGAAGATTGTGAAGGAAAAAATATCAATTCTCTAAAAAAAAAAATCCTTCCTTTTGAAGCAAACTACATCATACCTCTTCGTAAGATGGAATTTCACGGCAATGCCTATATGAGACAGGTGCTAGATGATGTATTTCCTTACTGGGAAGGTACTTCTCAGTGATAATTGGTTATTGTTTGGACAGGGGATTTATGAGCTAAATTGTGCTTCCCCCAGATTCTGTATGTTGAAGCCTTAGCATAGAGTACATCAGAATGCAACTGCCTTTAAAGATTGGGCCATTGAAAAGGTGACTAAGACTCAATCTGACTGGAAGTGGCAAGACCCAAGGGAACATGCCCATCCATGGAGGAGAGGCCAGGTGAGAACACAGCAAGAGGGTGAGTGGCTTCAAGCCACAGCAAGAGGCCTGGAGAGAGACTGCACCTGCTGATAACCTGATCTTGAACTTCCAGCCTCCAGCATGGTGAGACAAATAATTTTTTTAAACCACCTGATCAGTGCTTCTTTGTTATTGAAAGCCCTAGCAAAGTAATACAAATGGAGGGATGCAATTTGGCATACATTTATTCACTTCTGTCACACTCCACGTTCTGCTGACCTGTAAGCTAAAGGAAAATGTGTCTGTCCCCCTCATCAATGGTGGAAGAGCTACAGGAAAAACAAAATAAAATCCCTTCACCCCATTTATAAAATGGAAGAAGAGGAAACACAGCAACAACCCATCCCTAGCAGTTTGGGCAGCTGCCCTCATCCTAGCAGTAGGGGAACTTTCTCAATTATGTCCTCATTCTGCTTCCTTGCAGTGACTCTCTCGCCTCCTTTCCTCTGTGCTCTCTGGGAGATTGTCTTCTATGATCATATCCACAGCAGGCATCTGGGAGCTTACCCTTCTTCGGGTTTGCACAAATTTCACAGGCAACTTCACACTGGCGGGATTTGGGAGAGTGAAAGGGTGATTTTACTGTCAAAGATTCTTAAGCCTACAGTAATAGTTTCTTTGGAAATAAAATTTTCTAAGAAATAGGTAGGCTTTTAATCTACTTGACGCTAGTTAGTTCCATGTGTCAGTATTTAAAGTTTATTACGAGACTGGGTTCTCACACCTGCTTTACATTTGCCCCTTCTTTGCCTAAGCTGATCTCTTCCACACTAATGGTGGCTACCTTTGAGACTGTTGAAAAAATAGGCTTAGGAAGGAGCTATCTTTCTGAACCTAACATTTGCTTATTTATTGAGTCCTTCTGTTGAACTACAGTTTTTAAGTTTTTGTCTTGTTTTAGTTACTCAAAATCATTTTGAATTTAATCCCTTTCTTTCTAGTGTCTGGAAGTTCTTGCCTCTTCTCACCCTTCAAAGCTCCATATCTTGACTTTCTACTTGCTTCTGTTTCTAACGAGTGATTCTTATCCAAATTCACCCATATTATAATATCTTGGTGCTCTCTGCAAGCGAAAGAGAACTCAAAGTAACACTCTGGTCCTTCCTGGCCACTTCCCTTAGAGTGGTGTGAATTTTTGTGGACATTCAACTCTGCTGCCACAGACACAAAATCCCAAACTGAAGAACAGCAATAACTAGGGTTCCTCTGCAAAAGAAAGAGGCTTAATTGACTCATAGTTCAGCAGAGCTGGAGGGGGAGGCCTCAGGGAAGTTACAGTCATGGCAGAAGGCAAAGGAGAAGCAGGCGTCTTCTTCTCAGGGTGGCAGGACTGAGTGAGTTCAAGCAGGGGAAATGCCAGAAGTTTATAAAACCATCAGATCTCATGAGACTCACTCACTAGCATGAGTACAGCATGGGGGAACTGCCCCCATGATCAATTACCTCCACCTGGTCCTGCCTTTGACACATGGGGATGACAACAAGTCAAGATGAGATTTGGGTGGGGACACATAGCCAAACCATATCAATGTGTATATATTTCTGTATTTAAAATATACTTACATGTGATAATAAATAATATATTTATATTTATCATATATTTTATACATATAAAATATACATTTATATACATACACATATACATAGATGTGTGGATATGACTGTGTGTATATGTGTGTACTATATTTCCTCAAAATACTTATCATTGAGTAGATAAATCATTTTTTTTTCAATGATACAACTGAATAGCCATAACAAGGAACAGAGAATTCAGATTCAGGAACAAAATGTAAACAGCATGTTCATAGAGTGTGAGACATTGAGAGTTTCTCATTGCAGGACTTGCAGCCAGTTTTTCTGAATCTGTGTCCACTTCTCTTTTCACTATCACGTATTGAGCTTAGAGCCAGCCCAGCAAGCAGAGAAAGTACAACATGGACTTTCCACAAGCACAGGTTTCCAAGAGTGATTTCCTCCAGGACTACTAACAAGGAAGAGAAATTTCTGAAGCCCTCAGTCCTGAATTTGGAGAGCTCTACCCCTGCAAGAAAATGCCTGTTAACATAGCTCTGCTGGGTATAAAAAGAATTTTATTTTGGATGGCAGTTGGCTATTTTATTCCCTGAATCCTCAGTCTGACTCTATTTCATGGGGTGTCGACTCTGTCTGTGATTACTCCAATGTTCAGGTGCAGAGAAGTCAATGTTTATGAAAGTGATGTCCCTGTCAGTAGCAAGCATATCATCTGGCCCCCCGAGCTGTCAAAGAACAGATTGTAGAATTACCATTAGAATACAGGAGTTTATAGCTGCAGGCAGTAAGTGCAGAGCCGGTAAGCATATGTCCCCAGCATGATATTTTAGCTTCATATGAAGCCGTAAAGTGGAAATAAGCCAACAGTACAGCAGCAACTGCTAACTGTTCTGTCTCTCCATGTTTCCACATTGTGCCATATGTCTGGGTAATTCTCAGTAAAGGGGGCATTACTGTCTCTCAGCTGACTGAGAACATTTCCCAAAAGGGCTCAAAAAATTGGTGCGAGACTATGGTCACAATGACCTCACCTACTTTTATTGTCCAGCTGGCCTCATGGATTTTTCATTTAACTCTGGTAGAGACGTGGATCCTCTCTCAGCATTGATTAATTATGGTGAGAAAGTGAAAACTTTCTTAGAGTGAAAAAAAAAGTTCTTGAGTCTTCCAGATGTCCGTGTCTAGATGGTTAATATTTGCTCCAAAGGTTGAATAGGATTTTATAAAAGGAAAGCAAGAGATCTTTACATTATTCTTGAAGTGATATCAGTTTTTTTAAAATACAAAAATAACTAATTAATGCTAGCCTAATTAGCATCCAAAAATATGAACCATACATTATTTCAGGAAAGACAAAACTGCCTCCTGTGGATCCAAATCAGGAGGGATTCTATGCAGTTGGAAGAAGAGAGGCTTTGGAATGAGGGATATGGATTCTGTTTTCCACTTTGCCAGTTATAAACCGTGACCTTCATCAAGAGTTCAAACTCCTAGAGTCTTTGCTTTCTCAAGTGTAAAGAGATGCTAGTAAGTTGCAGGGGTGTGCATACATTTTCCCAAGGAGCTCATAAGAAGTGCCTATCACGATGAATTTCACACAACAGGGACCCCATACATGTTAGTGACCGTCCTGCTCAGCTCTGGATGAAGTCAGATTTAATCTTAAGATTGGAGAATAAGGCAGAGACTATTATCTCAATTTATGAGTCAAAAAACTGAATTTCAAAGAGATTAATTAAACTTCTCCATATTTTATTTTAGAGGAAAATGCTTAGACTTAAACCCAGGACCCTATAATTTCAAATCCCATGCTAATTTCACTACGACATGATGCCTTGTGAAAATAATGAAGCAAATTCTCTTTCCTATGAACTAAAGTTTTCAGTACTAAAAGTTTCATAGTTCTTGTATTCCACACATTTTTGAACTGATATTTATTTTTGGCAGTATGACCCATGCATATGCCTAGTATATGATTTCTGTAATTTTTATCAATGACATATTCATCTAAAATTATGACAGCTAAAGGTATTTATGTAAACTACACAAATAAATGTGATATTCATAGGGCTTTCCTTGGAATCATAAACTATAAGGAATTAATGACATGAGTGTTAGTACTGAGCTGCACCAGCCCCTCTGTTTAGCAGGACTAAACTATATTAGCCGAATGCTCCACCTGTGTGTAAAAATATCTTTCAATGGGCATCACTTTAAAAACAGATGCTATTTTGTGAAACAATCTCATATAAAACCTCAATACAGTTAATATCTTTCAGAACTGTCTAAATGTCTTTTATTAAAAATGCATTCCTGGCCTCTCTGAGTCCATGTGCTCATCTGTTGGAATGCAAATGAACACTTCTACTGTTGTAGAGTTCTTTATCTGTCACACAGACCCATGTGCCATCCACAGCCTCCCCACTCCCATGAAGGCAGGTGGTTTCTGTGTCCAGATTCAGCCAATGGGCTTTGAGTGGAAGTAAAGTGTGTCACCTCCATGTAGATGTTCAACAAAAAGTAGCTTAATAACAATGCTAATAACCGTACAATAACATTAACAGTGGTATGTATTAATTTCCAATCAGATCTTGATTTACTTTTCCTGGTATCTGATTGGCTTATAGAGACTTTTGCCACAGTGTTCTTTCTACTTTTCCTACCTTCAGTTTTCTTCATCCTTCCTTTATGCTTTTCAAAAAAAATTTCTTTCATCTAAAGCATGTTTGTTTACATTTAAGGCCCCTCTCAACGTGACCCTAACTACTGCTCCAGAATCATGGATTTTCTTAGTTCTCAATCTTACCAATGAATATTCATTTCCTGTTATATACATCAGCCACCTGGATTCCTGATCTTTTCTGAACAGCAGTGGCTTTTGCACAACGTCACACCTTTGCAAATTGTGTTATCCTCACTGAAGCGTCCTTGACATGTCCTCACAGTCACCAGATCTGAGAGCCTGACTCCGAGGGCTCTCTGGGGTCTGTGATTTGTTCTGCTGGATGATGGCACCCACAGGGTTCCGTCTGAGACACAGGTCAGAAGTGCACTCTCCCGGAATGCGTAGACTAAGTTACAGCAAAAGTAAACAGTACTGAAGCAGCTCAAGAGGGCATCTAATTGAATTATGCCAATGATTAAGTGCTCTAAATATCTATTCAATCATCTTGCCTCTACCCAGATGAGATAAAAGAATCAAGCAGGAATTATTAGAAAGGAAGAAAAATAAACTCACACTACAAATGCTGGGAGAAACTTTTTGATAGAGAAGCATAAATGAATGAAATGTCCCCCAAGAAGGCAGAGGAGCAGCACAGAAATCAAATCAGGTGGTGCTGGGCCACGATGGAAGAGAACTGGGTCAGGGAGGGAGGCCCCTGGTGTGTCACTCACCTCTCACCCTCCACTTAGCACCTCATGTCCAGAGGAGAGTGCTGTCTGCAGTCACGTCCTTCAATCTGCACATTTATTTTGGGTCTAAAGTCGATGCTTCTTTATTTCCTTTTTGTCTTTCACGTTGAGATTTTCCTCCTGTATCTCTTTGGATTGATACTGTTGGGGTAGTACAAAAAAATGCAGACTTTCCTGGTTAGGCCAGCCTTGGTTCCAATCCAGCTCAGTCCTTTTTAGCTTGTGGTCTTGGAAGGGTTACTTTGTCTTTCAATCCTCTGCAGCTTGGAGACTGGAATCCCAATCACAAAATGCTGCTTATTTATTTATTCAATTGATTATTTGCTCATTCAAGTAGTTGAGCTCTGATTGTCTGACAAACCTTGGGCTAGTTGCTAGGATTGAGACAATGGGCAAAATGTCAAGACCCTTCTCCTGGGATCTTCCAGTCCAGTGGAGCATGAAATAAAATCATGTGTAGGCAATGTCCACCTCAGTGCCTGGAATATAGTAAGTGCTCAGTAAACGGGACAGTGGCTCCTGTCCTCTTTCTTTTCTTATCCTTCTCACACACTCTTCTGTGCCTCTGTCCTCCAGCCCCCCCAGGGATTCTGACAACAAAGGTTTCTAATTTCTTTCCCAGCTTAGAGTATTGAGACAAGATTTGGATGAGCAGCCAAACGGAGAATTTCTCCTGGGAAACTTCAGCAACTTGATGCAGCTGCTGAGCAGAGGCCTCATTTTACGGGACCTCGTTGTCATCCCATGCACTGCATCAGCAGCGATTCAGAGCCTCGCTGGAAGGAGCGACAGGACAAAGGAAAAGACAGGGTTCGCACAACACAGAAGCAACGATATCCCCAGAAAATAAACCAACAAAACTAAACCCCAAAACCTCCCTTCCATTAACAGAGCCACTTAGAATATTAAAGGTTTATACGTCAAATGGCATCTTTTGATCCCTACAAGACAAAGATGTTACTTTTATGATCCCCACTTTACAAGATGTGGCTCAGAGAGGATGAGAATTTATCCAACTGGTTCAGTCAAGGTTTATTTTGCTTTCTTTCCTAAAAAAAAAAAATCCTGCAATAGACACTAACTATGGCTGGTTTAAGCAGAAGATAAGCTGATTGAAAGGACATCAGTCCATCACAGAACTGTCAGGTGGCCCAAACCAGCAGTGTCAAGGTTACGCATTAAGAATCAAACCCCTACCCACGCCCCACTACGGGAAGCAGATGCCCACCTCCTGCCCCACAGTGGGCACTACTGGAGCGTATGTAGCAGGACCATGACCTCAAGGGAACTGCTACCTCCACCGCCACAGTGAACAGTGAGACTGTACCTCCACCGCCACAGTGAACAGTGACGCTGTACCTCCACCGCCGCAGTGAACGGTGACGCTGTACCTCCACCGCCGCAGTGAACGGTGACGCTGTACCTCCACCGCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACCTCCACCCCCGCAGTGAACGGTGACGCTGTACTTCCACTGCTACAGTGAATAGGGACACTGTGCGCCATCTCAGGGCAGAGGAAAGGGGAGAACCAGTGACCTTCTTCCTCTCTGAGTGTCTGTCTCTCATTGCCACCCATGCAGAAGGGACTCCCTTAAACACAAGGAGAAGTTCCTGATGCTGGATGACAAGGCAATGACAGATACCCAGTAAAACCAAGTCCATGCGGCCTCAATGGGAAGAGCTCATTCTGAAAATGTAGTTCCAATTTCTAATTCAGTCCTCTTTCCACTATACTACTTTGCATAATAAGCAACAGGTGTTGGAATATGACCCTCTTCTCATGACTGTTGTTGTTATCATAAAACAAAACCTTCTACCATTACTTAGTCTTTTATCATTTACAAAGAAATCCCTTTTTAGTGACCTTTATAACCACCCTGAGAGGGAAGCAGGCAAGTAAATAACTCTATTTTCTTTTCTTCTTTATTTTTTCTGATAACAAAATGTCTAAAGAAGCACCTGGTACTTATGTAATCAAAGCACTTCCAATACTGAAACAAAAC	~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~e~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~P~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~h~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~y~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~i~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~q~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~^~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~}~~~~~~g~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~q~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~}~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~>~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~t~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~V~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~`~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~t~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~k~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~|~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~t~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~m~r~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~y~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~>~~~~~~~~~~~~~T~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~\~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~z~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~z~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~Y~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~n~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~s~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~i~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~x~~~~~~~V~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~p~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~m~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~L~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~{~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~N~~~j~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~}~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~k~~~~~~~~~~~`~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~r~~~~~~~~~~y~~~~~~~~~~~~~~~~~~~~b~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~f~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~T~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~t~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~R~~~~~~~~~~~~~~~~~~~~~~~C~~~~~~~~~~~~~~~~	RG:Z:${TMP_DIR}	NM:i:63	ms:i:19626	AS:i:19671	nn:i:0	tp:A:P	cm:i:1182	s1:i:9621	s2:i:635	de:f:0.0028	rl:i:458

mebbert avatar Jul 26 '23 18:07 mebbert

@mebbert Excuse me, did you find a solution to this problem?

quanc1989 avatar Sep 08 '23 07:09 quanc1989

Hello @quanc1989: we haven't heard anything back about a fix on the issue. Are you seeing it too?

To get around it, we lowered validation stringency for this sample. We don't like doing that, but it shouldn't be a problem.

mebbert avatar Sep 08 '23 14:09 mebbert

Thank you @mebbert . I also encountered this error when aligning to CHM13 v2. I also suspect that the reference affects this error. I will try to lower validation stringency for PICARD. Thanks a lot.

quanc1989 avatar Sep 09 '23 03:09 quanc1989

Hi mebbert and quanc1989, I also got same error from picard. I used minimap2 v2.26 and aligned to CHM13 v2. I tried with same sample aligned to hg38 and it was successfully completed without lowering the validation stringency for picard. @quanc1989 your suspect for the reference effect seems correct but I don't know why

asmmahmoud avatar Dec 20 '23 15:12 asmmahmoud

Thanks @AsmaaSamyMohamedMahmoud and @quanc1989!

Interesting to see that the reference does matter.

mebbert avatar Dec 20 '23 15:12 mebbert

2024, I'm with you I have

No M or N operator between pair of I operators in CIGAR No M or N operator between pair of D operators in CIGAR

on ONT reads after minimap2 on hg38 in dorado basecalling [email protected] at 5% of my samples However they are using minimap2-2.25 (r1173) fork (but no such fixes decaried in 2.26, so...) I could provide reads if it would be usefull

Next I gonna test CHM13 v2

pustoshilov-d avatar Jan 16 '24 12:01 pustoshilov-d

Hi everyone,

I've run into a similar issue with this thread as well. So in my case I used minimap2(v2.26) and bwa, but also I wanted to mark and remove the duplicate reads using sambamba markdup or PICARD MarkDuplicates. 1) In the first scenario using BWA and sambamba everything worked smoothly, identifying the duplicates and then removing them successfully. However, I used the same reference genome but from the ENA browser. 2) When using minimap2 with sambamba and a same reference from RefSeq I encountered this error: [W::bam_hdr_read] EOF marker is absent. The input is probably truncated I did check the BAM files and SAMfiles with quickcheck and everything seemed okay to me. Then I found another thread that tries to fix the sambamba issue since I was thinking this is a sambamba problem. So, using this time dev sambamba markdup /dev/stdin . However, this gave me this error: sambamba-markdup: not enough data in stream 3) So then I decided to use PICARD instead as alternative, and then this brought me to this thread, because I had the following error:

Exception in thread "main" htsjdk.samtools.SAMFormatException: SAM validation error: WARNING::ADJACENT_INDEL_IN_CIGAR:Read name m84128_231104_112949_s2/253035149/ccs, No M or N operator between pair of I operators in CIGAR
        at htsjdk.samtools.SAMUtils.processValidationErrors(SAMUtils.java:457)
        at htsjdk.samtools.BAMRecord.getCigar(BAMRecord.java:284)
        at htsjdk.samtools.SAMRecord.isValid(SAMRecord.java:2103)
        at htsjdk.samtools.BAMFileReader$BAMFileIterator.advance(BAMFileReader.java:848)
        at htsjdk.samtools.BAMFileReader$BAMFileIterator.next(BAMFileReader.java:834)
        at htsjdk.samtools.BAMFileReader$BAMFileIterator.next(BAMFileReader.java:802)
        at htsjdk.samtools.SamReader$AssertingIterator.next(SamReader.java:574)
        at htsjdk.samtools.SamReader$AssertingIterator.next(SamReader.java:553)
        at picard.sam.markduplicates.MarkDuplicates.buildSortedReadEndLists(MarkDuplicates.java:524)
        at picard.sam.markduplicates.MarkDuplicates.doWork(MarkDuplicates.java:257)
        at picard.cmdline.CommandLineProgram.instanceMain(CommandLineProgram.java:305)
        at picard.cmdline.PicardCommandLine.instanceMain(PicardCommandLine.java:103)
        at picard.cmdline.PicardCommandLine.main(PicardCommandLine.java:113)

To sum up, I think the problem might have something to do with minimap2, but I'm not entirely sure what it is. Did someone have already found any solution?

Thanks

gforg34 avatar Mar 04 '24 16:03 gforg34