auto-novel icon indicating copy to clipboard operation
auto-novel copied to clipboard

对于有重叠部分的术语,防止更新较短的术语时,重翻长术语的段落。

Open PipeYume opened this issue 7 months ago • 1 comments

从长到短查找单词。查到后,将段落split为多个,多个段落中不存在这个单词。之后再在多个段落中查找较短的单词。防止重翻时,如果更新的是短术语,而长术语中又恰好包含这个短术语,则避免重翻只包含那个长术语而不包含短术语的段落。

例子:对于这个段落,同时存在 ディー 和 ディーゼル 的术语。 jp.幽鬼test.txt

修改前分段术语表检测 修改后的分段术语表检测
获取未翻译章节 jp.幽鬼test.txt

[0] jp.幽鬼test.txt/0  segGlossary:{}  分段1/8 从缓存恢复  segGlossary:{ "ディーゼル": "迪赛尔", "ディー": "迪" }  分段2/8 从缓存恢复  segGlossary:{ "ディーゼル": "迪赛尔", "ディー": "迪" }  分段3/8 从缓存恢复  segGlossary:{ "ディーゼル": "迪赛尔", "ディー": "迪" }  分段4/8 从缓存恢复  segGlossary:{ "ディーゼル": "迪赛尔", "ディー": "迪" }  分段5/8 从缓存恢复  segGlossary:{}  分段6/8 从缓存恢复  segGlossary:{ "ディー": "迪" }  分段7/8 从缓存恢复  segGlossary:{ "ディー": "迪" }  分段8/8 从缓存恢复 上传章节

结束

获取未翻译章节 jp.幽鬼test.txt 

[0] jp.幽鬼test.txt/0  segGlossary:{}  分段1/8 从缓存恢复  segGlossary:{ "ディーゼル": "迪赛尔" }  分段2/8 从缓存恢复  segGlossary:{ "ディーゼル": "迪赛尔" }  分段3/8 从缓存恢复  segGlossary:{ "ディーゼル": "迪赛尔" }  分段4/8 从缓存恢复  segGlossary:{ "ディーゼル": "迪赛尔" }  分段5/8 从缓存恢复  segGlossary:{}  分段6/8 从缓存恢复  segGlossary:{ "ディー": "迪" }  分段7/8 从缓存恢复  segGlossary:{ "ディー": "迪" }  分段8/8 从缓存恢复 上传章节

结束

可以看到,修改后的仅存在ディーゼル的分段中不会检测到ディー,这样重翻的时候,如果修改了ディー,则仅存在ディーゼル而不存在单独的ディー的分段不受到影响。

PipeYume avatar Jul 11 '24 15:07 PipeYume