kunki
kunki
如果加入「次要候選項表」,那自然更好。我給出提議是儘量攷慮不修改前端代碼,直接在既有的基礎上分離兩个邏輯上應該獨立的淸單選項。這也是爲開發者的工作量做攷慮。 由於還未用新版小狼毫,所以不知「摺疊開關選項」是如何處理「多選項開關」的(比如我掛載了多个simplifier來實現傳統漢字、簡化字和臺標的切換)? 我个人傾向於將「簡化字」「臺標」開關做成通用的補靪應用到我所有使用的方案中,而不是新建一堆子方案(我有很厲害的强迫症,不習慣方案選單太過宂長),以應對填表之需(在某些必須用簡化字和臺標字(比如査閱《重編國語辭典》)的場合)。
要加載cjk_minifier同時設置enable_charset_filter: true
我人为在明月拼音和地球拼音中分开了单字和词组,每次处理时这两部分是分开处理然后再贴进去的。 做成单字和词组两个词典即可,再细分的话有必要吗?
@lotem 目前词库文件行数太多,没法在github上直接显示出来,这的确是个问题。 但是细分成几十个小文件的话,对于维护者来说似乎不太友好。若是要排重,或是批量修复某一单字读音,需要检查所有文件,客观上增加了开支。 除非能想到比较可行的方案解决这个问题,否则我是不太赞成这么做的。
@jakwings 我啥都沒修改,就是對候選框有些好奇,點了然後又取消了。
@boboIqiqi 建議用 notepad++、vim、EmEditor、sublime 等(我平常使用的編輯器)打開碼表文檔,再貼到 Excel 裏頭加工,而不是直接轉爲 ANSI。否則所有的擴展區的字會變成問號。
@LEOYoon-Tsaw 就你說的「另一個負責以某個**標記**(我姑且稱之爲「錨點」)爲準把大詞典拆成小的」而言,在匯總後的大文檔中這些錨點的相對順序是不能打亂的,導致我不能愉快地使用 Linux 裏的sort、uniq、grep、awk 等工具來處理碼表。 其體驗會比沒有錨點糟糕多了。
@lotem 這個文檔有比較完整的兩岸詞彙讀音差異,可以參考一下,以完善目前brise預設兩款拼音詞庫的不足: https://github.com/g0v/moedict-data-csld/blob/master/%E4%B8%AD%E8%8F%AF%E8%AA%9E%E6%96%87%E5%A4%A7%E8%BE%AD%E5%85%B8%E5%85%A8%E7%A8%BF-20160620.csv
@osfans 我覺得對於大陸的繁體使用者而言,臺灣標準的`luna_pinyin_tw`應該比OpenCC標準的`luna_pinyin`更有用。因爲臺灣標準是目前繁體中文最主要的事實標準,相當多的大陸人學繁體也是選擇臺標的。其他主流的拼音輸入法內置的繁體標準大致上也相當於臺標(除了「幺-么」等字沒處理到位)。 故而我覺得把`luna_pinyin_tw`迻除要慎重。
該字見於齊金文和楚簡。 古文字譜系疏證·黃德寬·商務印書館·2007 p1003  齊文字編·孫剛·福建人民出版社·2010 p337  戰國秦漢簡帛古書通假字彙纂·白於藍·福建人民出版社·2012 p834  战国楚系简帛用字习惯研究·禤健聪·科学出版社·2017 p60-61  