OpenCC icon indicating copy to clipboard operation
OpenCC copied to clipboard

Is this module support "traditional\simplified chinese" identification

Open frankShih opened this issue 2 years ago • 3 comments

請問是否支援繁體\簡體中文辨識功能?

我嘗試找一些 python 的方案,但沒看到合適的 ...

frankShih avatar Mar 04 '22 02:03 frankShih

一个简易的实现方案:根据 STCharacters.txt,把每行制表符左面的记作简体字,右面的记作繁体字。统计你输入的文本里面简体字的数量和繁体字的数量,然后比大小(×)

tiansh avatar Mar 07 '22 01:03 tiansh

比大小是為了處理繁簡剛好是相同編碼的狀況嗎?

frankShih avatar Mar 08 '22 03:03 frankShih

不知道你的要求是什么, pypi hanzidentifier (基于pypi zhon)好像至少可以满足我的要求。看了一下hanzidentifier 的源码,属于比较简单的那种。

ffreemt avatar Jun 02 '22 02:06 ffreemt