对于有重叠部分的术语，防止更新较短的术语时，重翻长术语的段落。

Open PipeYume opened this issue 1 year ago • 1 comments

从长到短查找单词。查到后，将段落split为多个，多个段落中不存在这个单词。之后再在多个段落中查找较短的单词。防止重翻时，如果更新的是短术语，而长术语中又恰好包含这个短术语，则避免重翻只包含那个长术语而不包含短术语的段落。

例子：对于这个段落，同时存在ディー和ディーゼル的术语。 jp.幽鬼test.txt

修改前分段术语表检测	修改后的分段术语表检测
获取未翻译章节 jp.幽鬼test.txt [0] jp.幽鬼test.txt/0 　segGlossary:{} 　分段1/8　从缓存恢复　segGlossary:{ "ディーゼル": "迪赛尔", "ディー": "迪" } 　分段2/8　从缓存恢复　segGlossary:{ "ディーゼル": "迪赛尔", "ディー": "迪" } 　分段3/8　从缓存恢复　segGlossary:{ "ディーゼル": "迪赛尔", "ディー": "迪" } 　分段4/8　从缓存恢复　segGlossary:{ "ディーゼル": "迪赛尔", "ディー": "迪" } 　分段5/8　从缓存恢复　segGlossary:{} 　分段6/8　从缓存恢复　segGlossary:{ "ディー": "迪" } 　分段7/8　从缓存恢复　segGlossary:{ "ディー": "迪" } 　分段8/8　从缓存恢复上传章节结束	获取未翻译章节 jp.幽鬼test.txt [0] jp.幽鬼test.txt/0 　segGlossary:{} 　分段1/8　从缓存恢复　segGlossary:{ "ディーゼル": "迪赛尔" } 　分段2/8　从缓存恢复　segGlossary:{ "ディーゼル": "迪赛尔" } 　分段3/8　从缓存恢复　segGlossary:{ "ディーゼル": "迪赛尔" } 　分段4/8　从缓存恢复　segGlossary:{ "ディーゼル": "迪赛尔" } 　分段5/8　从缓存恢复　segGlossary:{} 　分段6/8　从缓存恢复　segGlossary:{ "ディー": "迪" } 　分段7/8　从缓存恢复　segGlossary:{ "ディー": "迪" } 　分段8/8　从缓存恢复上传章节结束

修改前分段术语表检测

修改后的分段术语表检测

获取未翻译章节 jp.幽鬼test.txt

[0] jp.幽鬼test.txt/0 　segGlossary:{} 　分段1/8　从缓存恢复　segGlossary:{ "ディーゼル": "迪赛尔", "ディー": "迪" } 　分段2/8　从缓存恢复　segGlossary:{ "ディーゼル": "迪赛尔", "ディー": "迪" } 　分段3/8　从缓存恢复　segGlossary:{ "ディーゼル": "迪赛尔", "ディー": "迪" } 　分段4/8　从缓存恢复　segGlossary:{ "ディーゼル": "迪赛尔", "ディー": "迪" } 　分段5/8　从缓存恢复　segGlossary:{} 　分段6/8　从缓存恢复　segGlossary:{ "ディー": "迪" } 　分段7/8　从缓存恢复　segGlossary:{ "ディー": "迪" } 　分段8/8　从缓存恢复上传章节

结束

获取未翻译章节 jp.幽鬼test.txt 
[0] jp.幽鬼test.txt/0
　segGlossary:{}
　分段1/8　从缓存恢复
　segGlossary:{
"ディーゼル": "迪赛尔"
}
　分段2/8　从缓存恢复
　segGlossary:{
"ディーゼル": "迪赛尔"
}
　分段3/8　从缓存恢复
　segGlossary:{
"ディーゼル": "迪赛尔"
}
　分段4/8　从缓存恢复
　segGlossary:{
"ディーゼル": "迪赛尔"
}
　分段5/8　从缓存恢复
　segGlossary:{}
　分段6/8　从缓存恢复
　segGlossary:{
"ディー": "迪"
}
　分段7/8　从缓存恢复
　segGlossary:{
"ディー": "迪"
}
　分段8/8　从缓存恢复
上传章节
结束

可以看到，修改后的仅存在ディーゼル的分段中不会检测到ディー，这样重翻的时候，如果修改了ディー，则仅存在ディーゼル而不存在单独的ディー的分段不受到影响。

Jul 11 '24 15:07 PipeYume

你pr到了一个很尴尬的commit上面了，合并得等一会，不好意思😂

Aug 12 '24 06:08 FishHawk