OpenCC
OpenCC copied to clipboard
Conversion between Traditional and Simplified Chinese
My npm version is v16.When I run the "npm install opencc",the terminal show the error of node-pre-gyp.
System description: Windows x64. Python version: 3.9. Running "python setup.py build" results in the following error: ``` copying python\opencc\__init__.py -> build\lib.win-amd64-3.9\opencc package directory 'python\opencc\clib' does not exist. ``` This is...
請問是否支援繁體\簡體中文辨識功能? 我嘗試找一些 python 的方案,但沒看到合適的 ...
《通用規範漢字表》附件1列出了52個繁體字和異體字可以不簡化的情況。除掉目前已經收錄的、異體字本身就是傳承字(無需轉換)、繁簡採用相同的正字標準(只轉換對應正字,不交叉轉換異體字,比如爐炉,鑪𬬻,不納入爐𬬻和鑪炉),有16組一繁對多簡尚未收錄。全部是簡體字中認定一個字在某些情況下是異體字,但繁體中並不將該字認定為異體字。 剋:表示訓斥、打人時,不簡化作「克」 吒:用於姓氏人名時不規範作「咤」 昇:用於姓氏人名時不簡化作「升」 椏:用於姓氏人名、地名、科技術語時類推簡化作「桠」,不簡化作「丫」 氾:用於姓氏人名時不規範作「泛」 甦:用於姓氏人名時不簡化作「苏」 甯:用於姓氏人名時不簡化作「宁」 祕:用於姓氏人名時不規範作「秘」 絜:用於姓氏人名時不簡化作「洁」 脩:解作乾肉時不規範作「修」 蒐:解作草名或春獵時不規範作「搜」 袷:用於「袷袢」時不規範作「夹」 逕:用於姓氏人名、地名時類推簡化作「迳」,不規範作「径」 釐:通「禧」時不簡化作「厘」 陞:用於姓氏人名時不簡化作「升」 颺:用於姓氏人名時類推簡化作「飏」,不規範作「扬」
Error as titled. This error occurs when: ```typescript= const converter = new OpenCC('s2twp.json') ```
Issue #668 【繁体字辨析】注意「癥 zheng1」与「症 zheng4」这两个字: 1. 后者的写法简繁一致。 2. 前者的简化字不是后者,而是「征」。例:「綜合癥」→「综合征」。 3. 重編國語辭典收錄「症候群」其實是個錯誤,因為其組份「症候」的標準寫法是「癥候(征候)」。 ---- 有鉴于「症」的 zheng1 音在陆规简体中文当中被限定于中医的场合,所以最好将繁转简时的「症候」自动替换成「征候」。
支援新馬簡體
新馬的華文雖然已經轉為採用和中國大陸相同的簡化字方案,但新馬地區有大量特有的地區詞。希望可以支持CN、HK/MO、SG/MY、TW的地區詞互相轉換。 地區詞示例1 zh-CN 出租车 zh-HK/MO 的士 zh-SG/MY 德士 zh-TW 計程車
C:\Users\木羊羽\AppData\Local\Programs\Python\Python39\python.exe D:/Multifarious/Python/测试.py Traceback (most recent call last): File "D:\Multifarious\Python\测试.py", line 3, in converter.convert('汉字') # 漢字 File "C:\Users\木羊羽\AppData\Local\Programs\Python\Python39\lib\site-packages\opencc\__init__.py", line 87, in convert retv_i = libopencc.opencc_convert_utf8(self._od, text, len(text)) OSError: exception: access violation...
日本新字體
- t2jp 方案比照 t2s 採兼容「OpenCC 標準體轉日本新字體」及「日本舊字體轉日本新字體」的做法,因此除了 OpenCC 標準體轉日本新字體以外,也補上《常用漢字表》等表舊字體轉新字體的部分。 - 擴充轉換移至 JPVariantsEx.txt,包括《表外漢字字體表》非簡慣優先的簡慣字體(簡慣優先的直接放 JPVariants.txt)及擴張新字體。擴張新字體與日本標準無衝突的直接轉換,有衝突的預設不轉換,只作為第二候選字。預設轉換方案 t2jp 不包含 JPVariantsEx.txt,並增加包括擴充轉換的 t2jpx 方案。jp2t 則包括 JPVariantsEx.txt 的逆轉換。 - 擴張新字體清單主要沿用 #371,額外加了幾字。 - 「龝」雖是「秋」的異體字而非 OpenCC 標準字,但考量 t2jpx 也包括舊字體轉新字體,源文本未必是嚴格的 OpenCC...