rime-huma icon indicating copy to clipboard operation
rime-huma copied to clipboard

異體字選擇

Open ywxt opened this issue 1 year ago • 3 comments

以下標註✅的異體字優先安排簡碼,除以下所列項之外,亦當包含 #5 中所涉及之漢字。

  • [x] 群✅ 羣 ❌
  • [x] 峰✅ 峯 ❌
  • [x] 裏✅ 裡 ❌
  • [x] 爲✅ 為 ❌ (包括作部件所構成的異體字)
  • [x] 衮✅ 袞 ❌ (包括作部件所構成的異體字)

ywxt avatar Feb 22 '24 16:02 ywxt

個人建議將如「群」「羣」,「峰」「峯」,「裏」「裡」這類由相同部件組成而僅僅結構關係不同的異體字放到同一編碼的次選上,這樣能形成更爲直觀的兩字對比,且如 bt; 打出 手感也比敲擊 btdg 好得多。唯一可能影響到的就是那幾個簡詞,但我感覺真正需要那幾個簡詞的用戶應該極少。或者作者可以指教一下我如何將前述那幾組異體字放到同一簡碼的候選位上。

belovedrebellion avatar Nov 30 '24 08:11 belovedrebellion

huma.short.dict.yaml 搜索相關的字,按照格式追加即可,注意 漢字與編碼之間是 <Tab> 而不是空格。

我在攷慮是否可以做一個異體字開關,開啓後在每個字後追加相應的異體?

存在的問題:

  • 理論上像「群羣」與「花蘤」都屬於異體,但實際使用中二者詞頻差異很大,都出現是否符合用戶預期?如果只選擇部分,那標準又該是什麼?
  • 能否讓用戶選擇首選使用的變體?直觀上存在異體的詞組可能比較難實現。

ywxt avatar Nov 30 '24 09:11 ywxt

感覺不太現實,異體字的數量太龐大了,裏面必然有很多一般人完全用不上的異體字形。各種俗字與本字等更是不知用戶會偏好於哪一類,個人認爲還是宜用戶自己去做個性化設置。

belovedrebellion avatar Nov 30 '24 13:11 belovedrebellion