kunki
kunki
關於完整的詞庫,最好使用這份文檔https://github.com/lotem/brise/blob/master/essay.txt luna_pinyin.dict.yaml裏頭的詞彙是這份文檔中詞彙的子集,列出來的是含有多音字的詞語。而沒有多音字的詞語luna_pinyin.dict.yaml是不收錄的,目的是爲了壓縮詞典大小。
分析後發現,bpmf-ext.cin上面的注音信息質量很低,不建議導入。 近期會將unihan的讀音信息(Mandarin以及HanyuPinyin)導入到明月/地球拼音中來。 小麥注音輸入法與八股文的差異詞條暫時放在朙月拼音擴充詞典中。
第一步完成:https://github.com/rime/brise/commit/2c5960c21754c4cf80d25bc3e365ddeef0f1a293 下一步將繼續導入 Unihan8.0 的讀音資料以及[國際電腦漢字及異體字知識庫](http://chardb.iis.sinica.edu.tw/)列出的《漢語大字典》讀音。
目前只打算匯入 [unihan](http://unicode.org/charts/unihan.html) 和 [國際電腦漢字及異體字知識庫](http://chardb.iis.sinica.edu.tw/)的讀音(覈定多音字的字頻很麻煩,所以一直沒做),不再攷慮其他來源。
@ShikiSuen 因爲讀上聲本來就是錯誤讀音,不被官方承認很正常。沒看到這則issue從所謂的「國語正音」改成了現在的「習慣讀音」麼。
@ShikiSuen 都說了是錯誤讀音,所以官方不認可。要是人人都按照自己喜歡的讀音來,那義務敎育豈不是都白費了?也會讓遵守標準的人無標準可依。 《现代汉语词典》的「颜色(yan2 shai3)」表示「顏料或染料」,和「颜色(yan2 se4)」的詞義是有區別的。所以《现代汉语词典》才會分開收錄。 這和「亞」的錯音「ya3」(這个讀音不能區別意義,只是純粹的誤讀音)性質根本就不一樣好不好。
不帶輕聲那算作第幾聲?另,聲調是可以省略不輸的。碰到輕聲字你直接不輸入聲調嘛。
的確不打算修,因爲輕聲字的詞彙太多,覈對起來太麻煩。 再說還要問問@lotem 的意見
見過有些對輸入法有潔癖的人,不習慣前幾頁出現方框。 特別是這種常用字對應的類推簡化字,很容易出現在前幾頁。 另,我有攷察市面上的主流拼音輸入法,都是嚴格的GBK字符集,不含ext-a字。 當然,有部分GBK字因爲歷史原因未被即時提交到CJK基本區,導致長時間佔用PUA碼位。「中古全拼」碼表中的那些字就是這个問題遺留下來的。這類未被提交的GBK字後來都收入到了ext-a和ext-b區。 但是市面上的主流拼音輸入法輸出的GBK字符集字,仍然使用了這些PUA字。比如輸入「u long tian」(龙+天)輸出PUA字「」而非ext-a字「䶮」(QQ拼音輸入法實測)。 因此過濾掉ext-a/b/c/d/e字不會引起普通的「拼音輸入法」用家的注意。 換句話說,市面上除了rime,沒有能輸出擴充字符集漢字的拼音輸入法。
是不是要等到這个小狼毫版本發佈後再實現該功能? 另外,我也向公子另提一个proposal: 能否將「方案開關」與「輸入方案選擇」放置在不同的淸單上,通過不同的快捷鍵打開;而不是像現在一樣都雜糅到一个淸單上(雖然新版可以將開關都整合到一个候選項上,但是還是感覺有點條理不淸晰,不符合直覺)。 通過不同的快捷鍵來打開「方案開關」或「輸入方案選擇」可能會比較符合直覺。 特別是開關多了後(比如五个開關),直接把這个淸單都佔滿了(默認五个候選項)。 曾有位新人一直找不到切換輸入方案的辦法,就是因爲用F4打開「方案選單」後,看到的前五个候選項都是「方案開關」而非真正的「方案選單」。(然後他還不知有翻頁操作。) 所以說這種設計其實是有點不合直覺的。