librime icon indicating copy to clipboard operation
librime copied to clipboard

能否提供碼表選項,強制給所有詞自動註音?

Open jakwings opened this issue 8 years ago • 4 comments

相關 issue: rime/brise#110

需求是:不必爲含多音字的詞條太操心,解決漏註的問題。

不知道這個功能合不合理,實際應用會否導致組合爆炸?能不能保持手動註音的提示優先級?

jakwings avatar May 22 '16 08:05 jakwings

比如說有詞條:

崖 ya
崖 yai
山崖 shan yai

強制自動註音後,打 shan ya 能出「山崖」,但提示編碼依然爲 shan yai。

ghost avatar May 22 '16 08:05 ghost

「崖」字属于无条件的异读,但有些多音字是区分场合的,就不适合自动注音。

比如明月拼音的码表:

長 chang   60.26%
長 zhang   39.74%
縣長  xian zhang

如果任由其自动注音,会造成:

> xian chang
1. 县长
2. 现场

kahaani avatar May 22 '16 09:05 kahaani

這我也考慮過,可用作容錯。

這種情況下,我覺得詞序問題比較重要,這點漏算了。而一個自動註音總開關無法把合法跟不合法的分開。就算是單獨指出哪個詞可以隨便標註,也難免有例外。

不過我覺得這種勞力節省在詞庫沒達到一定精細化程度之前是挺有用的。我在改善粵語碼表,很多多音字不方便一一標明,但是又想有正确讀音或常用讀音的提示。

ghost avatar May 22 '16 09:05 ghost

有必要把能夠消除歧義的部分標註出來,類似於:

縣長 xian zhang[100%]

按照這種設計,假如「縣」還有別的註音,那麼也會與 zhang 組合,最後其他推導註音可能適當降低詞頻。但不會再生成包含 chang 的註音。

這套標註語法還要請語言學家來做設計,也許要擴展到很多特性。

lotem avatar May 23 '16 04:05 lotem