OpenCC icon indicating copy to clipboard operation
OpenCC copied to clipboard

程序自動生成的 HKVariantsRev.txt 不能處理「一香港繁對多 OpenCC 繁」

Open sgalal opened this issue 5 years ago • 3 comments

目前自動生成的 HKVariantsRev.txt 是:

台      臺
才      纔
核      覈
歎      嘆

實際上應該是:

台	臺 台
才	才 纔
核	核 覈
歎	歎 嘆

我手工做了一個:https://github.com/nk2028/opencc-data/blob/master/data/HKVariantsRev.txt

好在目前的應用場景(簡轉香港繁、香港繁轉簡)都不會出現問題,但是單看 HKVariantsRev.txt 本身應該是有問題的。

sgalal avatar Mar 27 '20 15:03 sgalal

可以單獨增加一個HKVariantsRev.txt,只保留有歧義的部分即可,類似於TWVariantsRevPhrases.txt。

BYVoid avatar Mar 28 '20 05:03 BYVoid

@BYVoid

可以單獨增加一個HKVariantsRev.txt,只保留有歧義的部分即可,類似於TWVariantsRevPhrases.txt。

我增加了 HKVariantsRev.txt,內容如下:

台	臺 台
吃	喫 吃
才	才 纔
核	核 覈
歎	歎 嘆
煙	煙 菸
胄	胄 冑
裊	嫋 裊

但沒有效果。生成的 HKVariantsRev.txt 仍然與原來相同。

sgalal avatar Mar 28 '20 06:03 sgalal

應該需要修改Cmake生成規則和配置文件。

BYVoid avatar Mar 28 '20 06:03 BYVoid