libchewing-data
libchewing-data copied to clipboard
內建字庫(word.csv) 跟內建詞庫(tsi.csv)優先順位問題
最近在整理內建詞庫,根據 README 的說明:
只是單純要加詞,改
tsi.csv加入就可以了,如果只是要更正字的錯誤注音,改word.csv就可以了。如果要新增本來沒有的注音 (破音字),請改word.csv之後,再到tsi.csv裡面加入這個字的優先數值和新增的注音拼法。
但是除非要調整部份內建字庫的優先順序,應該是不用再把單字加到內建詞庫 tsi.csv 中,只要直接新增在 word.csv 即可,不知道這樣理解是否正確?
沒錯,word.csv 裡面的順序決定手動選字的時候的順序
目前 chewing-cli init-database 預設會把一字詞的詞頻都歸零 但是不排除之後可以參考一字詞的詞頻