从长到短查找单词。查到后,将段落split为多个,多个段落中不存在这个单词。之后再在多个段落中查找较短的单词。防止重翻时,如果更新的是短术语,而长术语中又恰好包含这个短术语,则避免重翻只包含那个长术语而不包含短术语的段落。
例子:对于这个段落,同时存在 ディー 和 ディーゼル 的术语。
jp.幽鬼test.txt
| 修改前分段术语表检测 |
修改后的分段术语表检测 |
获取未翻译章节 jp.幽鬼test.txt
[0] jp.幽鬼test.txt/0
segGlossary:{}
分段1/8 从缓存恢复
segGlossary:{
"ディーゼル": "迪赛尔",
"ディー": "迪"
}
分段2/8 从缓存恢复
segGlossary:{
"ディーゼル": "迪赛尔",
"ディー": "迪"
}
分段3/8 从缓存恢复
segGlossary:{
"ディーゼル": "迪赛尔",
"ディー": "迪"
}
分段4/8 从缓存恢复
segGlossary:{
"ディーゼル": "迪赛尔",
"ディー": "迪"
}
分段5/8 从缓存恢复
segGlossary:{}
分段6/8 从缓存恢复
segGlossary:{
"ディー": "迪"
}
分段7/8 从缓存恢复
segGlossary:{
"ディー": "迪"
}
分段8/8 从缓存恢复
上传章节
结束
|
获取未翻译章节 jp.幽鬼test.txt
[0] jp.幽鬼test.txt/0
segGlossary:{}
分段1/8 从缓存恢复
segGlossary:{
"ディーゼル": "迪赛尔"
}
分段2/8 从缓存恢复
segGlossary:{
"ディーゼル": "迪赛尔"
}
分段3/8 从缓存恢复
segGlossary:{
"ディーゼル": "迪赛尔"
}
分段4/8 从缓存恢复
segGlossary:{
"ディーゼル": "迪赛尔"
}
分段5/8 从缓存恢复
segGlossary:{}
分段6/8 从缓存恢复
segGlossary:{
"ディー": "迪"
}
分段7/8 从缓存恢复
segGlossary:{
"ディー": "迪"
}
分段8/8 从缓存恢复
上传章节
结束
|
可以看到,修改后的仅存在ディーゼル的分段中不会检测到ディー,这样重翻的时候,如果修改了ディー,则仅存在ディーゼル而不存在单独的ディー的分段不受到影响。
你pr到了一个很尴尬的commit上面了,合并得等一会,不好意思😂