Zhiling Zhang

Results 17 comments of Zhiling Zhang

分别回答两个问题: 1. 速度慢的问题 算法基本是固定的,没有太多优化空间。可能的话,建议从数据层面优化速度,比如把这些语料按照行业/公司/岗位先分类,然后分别执行新词发现。因为算法的时间复杂度大约是平方级别的,分而治之可以提升效率,还可能为不同的维度提供不同的发现。 2. 指标排序问题 目前没有默认进行排序,不过这里为发现的新词提供了多个指标,可以按照需要选择合适的指标排序。 对于`new_words_info = ht.word_discover(para)`得到的new_words_info,它是一个这样的dataframe: ``` freq left_ent right_ent agg score text 父亲 0.008442 1.033562 2.397895 118.454545 0.060068 看见 0.005372 1.747868 1.549826 69.098485 0.032588 我的...

是本库的一个依赖库[pattern](https://github.com/clips/pattern)的问题,它需要mysql_config作为依赖。实际上我们大部分的任务不需要用到这个库,所以目前暂时把这个依赖去掉了。 目前本库只有在做英文的textrank时会需要pattern来做一下lemma,不做也可以运行,但是可能表现会稍差一点,需要用到这个功能的可以稍微留心一下。

本项目的情感分析算法基于SO-PMI,效果如何请参考[原始Paper](https://arxiv.org/abs/cs/0309034) 本项目本来是专注于中文的,但是最近太多人问了我支持英文的问题了,所以更新了一下,加入了包括情感分析在内的少量英语支持,例子: ```python # ♪ "Until the Day" by JJ Lin test_text = """ In the middle of the night. Lonely souls travel in time. Familiar hearts start to entwine....

根据错误信息,问题是出在我调用的pyhanlp的接口上。 建议首先检查一下pyhanlp的安装情况,可以尝试重装我本人使用的版本: ``` pip uninstall pyhanlp pip install pyhanlp==0.1.44 ``` 再试试看。 如果还是不行的情况: pyhanlp依赖于hanlp这个JAVA库的代码,这个错误好像就是没有找到对应的JAVA元素。 所以,建议检查一下对应的JAVA版hanlp的安装情况,命令行里输入: ``` hanlp -v ``` 正常情况下会显示版本,类似: ``` jar 1.6.7: D:\Program files\Anaconda2\envs\py36\lib\site-packages\pyhanlp\static\hanlp-1.6.7.jar data 1.6.7: D:/Program files/Anaconda2/envs/py36/lib/site-packages/pyhanlp/static\data config :...

最近在用另一台电脑的时候,发现了同样的问题。然后发现是hanLP自身的一个问题,参考[这个issue](https://github.com/hankcs/HanLP/issues/1221)后我修复了这个问题。 只要下载这个文件 https://github.com/hankcs/HanLP/files/3357416/hanlp-1.7.4.jar.zip 将解压后的jar文件覆盖掉 [你的python环境]/Lib/site-packages/pyhanlp/static/hanlp-1.7.4.jar 即可。 希望也能解决你的问题。

> Hey, I tried to do this, but when the model is loaded using Ray it doesn't work. I get this error > > ``` > --------------------------------------------------------------------------- > AttributeError Traceback...

The model by default uses 3-channel images (RGB), but it seems that you have images with 4 channels (like RGBA), may be try check and channel first and converting when...