OpenCC
OpenCC copied to clipboard
程序自動生成的 HKVariantsRev.txt 不能處理「一香港繁對多 OpenCC 繁」
目前自動生成的 HKVariantsRev.txt 是:
台 臺
才 纔
核 覈
歎 嘆
實際上應該是:
台 臺 台
才 才 纔
核 核 覈
歎 歎 嘆
我手工做了一個:https://github.com/nk2028/opencc-data/blob/master/data/HKVariantsRev.txt。
好在目前的應用場景(簡轉香港繁、香港繁轉簡)都不會出現問題,但是單看 HKVariantsRev.txt 本身應該是有問題的。
可以單獨增加一個HKVariantsRev.txt,只保留有歧義的部分即可,類似於TWVariantsRevPhrases.txt。
@BYVoid
可以單獨增加一個HKVariantsRev.txt,只保留有歧義的部分即可,類似於TWVariantsRevPhrases.txt。
我增加了 HKVariantsRev.txt,內容如下:
台 臺 台
吃 喫 吃
才 才 纔
核 核 覈
歎 歎 嘆
煙 煙 菸
胄 胄 冑
裊 嫋 裊
但沒有效果。生成的 HKVariantsRev.txt 仍然與原來相同。
應該需要修改Cmake生成規則和配置文件。