DSAlign
DSAlign copied to clipboard
Part of aligned text gets shifted to the next segment
I've seen this in DS 0.6.x and the current DS 0.7.x fork I'm working on but I cannot figure out why it's happening. The first aligned audio segment contains "av juli" but the aligned text does not.
{
"start": 77880.0,
"end": 81480.0,
"transcript": "en första preliminär rapport ska vara klar i mitten av juli", <= "av juli" is shifted to the next segment
"text-start": 1630,
"text-end": 1682,
"meta": {},
"aligned-raw": "En första preliminär rapport ska vara klar i mitten ", <= "av juli" is missing and there is a space here
"aligned": "en första preliminär rapport ska vara klar i mitten "
},
{
"start": 81570.0,
"end": 86100.0,
"transcript": "och den kan följas om en formell utredning om brott mot eus finansregler",
"text-start": 1682,
"text-end": 1761,
"meta": {},
"aligned-raw": "av juli. Den kan följas av en formell utredning om brott mot EU:s finansregler.", <= "av juli." should not be there
"aligned": "av juli den kan följas av en formell utredning om brott mot eus finansregler"
}
Same problem here! Did you found any solution in the meantime?