Dingyuan Wang
Dingyuan Wang
Do you have any suggestions on fuse 3 migrations?
是這樣,最好能根據選項頁面中是黑/白名單模式分別顯示為對某網站禁用/啟用的選項。
可以参考「地球拼音」的词典? https://github.com/rime/brise/blob/master/preset/terra_pinyin.dict.yaml
可以转啊
之前写的数字转汉字 https://github.com/The-Orizon/nlputils/blob/master/zhutil.py#L223
我觉得这个问题和词库/频率/模型有很大的关系。Jieba 的词库本身比较小,训练集也是用其他分词工具给小说和「社会科学类语料」分词获得的。从工程角度来说,Jieba的算法更简洁高效一些,实际使用上更灵活(如用其他语言实现),但是词库质量一般。 作为前维护者,这个项目本身长期缺乏维护,但处于「能用」水平。根据个人经验,各位若在意准确度,请自己训练/生成词库;避免使用自带的 HMM 模型;TF-IDF 请使用相应语境的 IDF 或换用其他工具。
词典好像没成功加载,删掉 /tmp/jieba.cache,下载最新版试试。 最新版 Python 2/3 均兼容
-e should point to the executable, eg. `-e /usr/local/bin/telegram-cli`
https://trac.torproject.org/projects/tor/wiki/doc/TorBrowser/Hacking
用 pypy 比 OpenCC 快,CPython 比 OpenCC 慢一点。