librime
librime copied to clipboard
能否提供碼表選項,強制給所有詞自動註音?
相關 issue: rime/brise#110
需求是:不必爲含多音字的詞條太操心,解決漏註的問題。
不知道這個功能合不合理,實際應用會否導致組合爆炸?能不能保持手動註音的提示優先級?
比如說有詞條:
崖 ya
崖 yai
山崖 shan yai
強制自動註音後,打 shan ya 能出「山崖」,但提示編碼依然爲 shan yai。
「崖」字属于无条件的异读,但有些多音字是区分场合的,就不适合自动注音。
比如明月拼音的码表:
長 chang 60.26%
長 zhang 39.74%
縣長 xian zhang
如果任由其自动注音,会造成:
> xian chang
1. 县长
2. 现场
這我也考慮過,可用作容錯。
這種情況下,我覺得詞序問題比較重要,這點漏算了。而一個自動註音總開關無法把合法跟不合法的分開。就算是單獨指出哪個詞可以隨便標註,也難免有例外。
不過我覺得這種勞力節省在詞庫沒達到一定精細化程度之前是挺有用的。我在改善粵語碼表,很多多音字不方便一一標明,但是又想有正确讀音或常用讀音的提示。
有必要把能夠消除歧義的部分標註出來,類似於:
縣長 xian zhang[100%]
按照這種設計,假如「縣」還有別的註音,那麼也會與 zhang
組合,最後其他推導註音可能適當降低詞頻。但不會再生成包含 chang
的註音。
這套標註語法還要請語言學家來做設計,也許要擴展到很多特性。