rime-terra-pinyin icon indicating copy to clipboard operation
rime-terra-pinyin copied to clipboard

半自動化處理異讀音

Open lotem opened this issue 4 years ago • 0 comments

單字的異讀音基本齊全。問題主要存在於包含這些單字的詞組。 需要腳本輔助發現既存的這類情況再做考察。

每加入一批數據都應當對包含多音字特別是異讀音進行干預。現存的問題源於之前導入數據時沒有做這項處理。

導入其他詞庫如果不經人工干預:無法保證每個數據數據源包含的詞條完全「對齊」,即不多不少包含相同的詞條,否則比其他來源多出的詞仍會缺失該數據源未收錄的異讀音,也就會出現本帖發現的問題。

不僅要審查導入的詞條,還得審查原有詞條是否需要標記新產生的異讀音。比如添加了「擊」的異讀音 jí,則須補充標註原有的、含其他多音字的詞條「長擊」。

Originally posted by @lotem in https://github.com/rime/rime-terra-pinyin/issues/29#issuecomment-785612828

lotem avatar Feb 27 '21 03:02 lotem