home
home copied to clipboard
有繁體的筆劃輸入法嗎?
現在 https://github.com/rime/rime-stroke 雖然碼表有繁體字,但那碼表對於繁簡統合了的Unicode字元,例如所有含有草花頭部件的漢字,依然是採用簡體中文的筆順,對於繁體中文使用者構成困惑。 另一方面,預設的筆劃輸人按鍵,用h,s,p,n,z來代表橫、豎、撇、捺、折,分散到鍵盤各處,不利連續輸入,而且所選的字母為相關漢字名稱的普通話漢語拼音首字母,對於不熟悉普通話,或者不熟悉漢語拼音方案的中文使用者而言,相關碼位難以記憶,因此希望能夠改善。
第二個問題簡單,在speller/algebra下做個mapping即可
笔顺没有简繁体之分,统一的规则可以应对所有简繁汉字。
笔顺没有简繁体之分,统一的规则可以应对所有简繁汉字。
由於Unicode把繁簡體不同寫法的字形合成同一個碼位,同一個字在繁體系統和簡體系統顯示的寫法可以不同,因此筆順也有差別。
樓主所述的可能不是簡繁之分,而是不同地區的筆順規範。 例如草頭三筆還是四筆,書法上兩種寫法都有的,不同的標準制定者會選取一種書寫方式定爲規範。例如中國大陸中文專業繁體字草頭也一律是以三筆爲準;日文中的漢字包含很大一部分傳承字,然而無論是否日文簡化字,草字頭都是三筆。
不能因爲系統字體不同,就當作不同的字看待。書法中的變體更多,舉個不恰當的例子,走之底點幾點、折幾折、甚至筆畫之間連不連,是不是都要用不同內碼區分、當作不同的漢字呢?如果正楷的些許不同寫法都要分,那麼更要爲篆書、隸書要造一大批「⾋」形的字了。而圍繞同屬一字的界定原則,Unicode已經給出了解答。
rime-stroke 的數據源顯然是按照「新字形」編碼。決不能在同一碼表中混合「新字形」和「舊字形」的筆畫編碼,會使出字混亂、使用不便。少量兼收多種筆順的字,限於同一字形有多種通行的書寫習慣。
樓主所述的可能不是簡繁之分,而是不同地區的筆順規範。 例如草頭三筆還是四筆,書法上兩種寫法都有的,不同的標準制定者會選取一種書寫方式定爲規範。例如中國大陸中文專業繁體字草頭也一律是以三筆爲準;日文中的漢字包含很大一部分傳承字,然而無論是否日文簡化字,草字頭都是三筆。
不能因爲系統字體不同,就當作不同的字看待。書法中的變體更多,舉個不恰當的例子,走之底點幾點、折幾折、甚至筆畫之間連不連,是不是都要用不同內碼區分、當作不同的漢字呢?如果正楷的些許不同寫法都要分,那麼更要爲篆書、隸書要造一大批「⾋」形的字了。而圍繞同屬一字的界定原則,Unicode已經給出了解答。
rime-stroke 的數據源顯然是按照「新字形」編碼。決不能在同一碼表中混合「新字形」和「舊字形」的筆畫編碼,會使出字混亂、使用不便。少量兼收多種筆順的字,限於同一字形有多種通行的書寫習慣。
我不是說想要把不同的字形的編碼全部合併到同一碼表內,但輸入法內應該要有能讓使用者按照個人慣用習慣來進行選擇使用何種書寫習慣的餘地。 至於說Unicode決定合併什麼字而不合併什麼字,很明顯那些決定之中有許多因歷史原因殘留的妥協和不完善且不一致的地方,很難說是如何區分的最終解答。何況Unicode在合併碼位後,也對各碼位在不同區域給出了不同的參考字形。