lixiang1991

Results 11 comments of lixiang1991

确实可以用,只要稍微修改下编码格式,替换orc接口就可以搜索了。还避免了识别文字出错的情况。

@asseywang 因为本来也不是我自己写的,就把楼主链接的那个copy过来了,所以就不提交了,贴在这里吧。如果是在没有开始答题的情况下requests获取不到数据,楼主链接那里也提供了示例数据用来测试。 文件:`GetQuestionTessAndroid.py` ``` from PIL import Image from common import screenshot, ocr, methods from threading import Thread import time import requests, json def get_question(): resp = requests.get( 'http://htpmsg.jiecaojingxuan.com/msg/current', timeout=5).text...

@RoyLaw 是因为根本就没用识别,哈哈哈。看看这个 https://github.com/Skyexu/TopSup/issues/33 混入的乱码应该是编码问题吧

@ljfyuyu 看看这个 https://www.sogou.com/web?query=%E5%93%AA%E7%A7%8D%E5%8A%A8%E7%89%A9%E7%9A%84%E4%B9%B3%E6%B1%81%E6%9C%80%E9%80%82%E5%90%88%E6%9B%BF%E4%BB%A3%E4%BA%BA%E7%B1%BB%E6%AF%8D%E4%B9%B3%EF%BC%9F 惊了一呆,不知道搜狗什么时候添加的这条知识

@ljfyuyu 对的,理论上偏推理的知识是需要构建知识图谱才好给出明确答案的。如果换一个问法还能指向同一个答案,那就说明语义理解水平很高了。

好的,谢谢指点,我再深入研究下

经过测试发现怎么样使用查找表都没效。 然后在rasa_nlu文档中看到了,Regex features 只支持CRFEntityExtractor。 而查找表也是在regex基础上使用的,所以它也不支持mitie。 都怪我看文档不够仔细

我用英文数据研究了几天,想要修改mitie的实体抽取部分以实现这个功能。 我发现crf的确能根据regex特征提取出只在查找表中出现,而examples中不出现的实体。mitie不行。 原因是mitie的python调用工具里,并没有提供“为token附加其他特征”的接口。也就是说即使"regex"组件为每个token附加了regex特征,但是最终训练时的数据集里还是把regex特征丢弃了。 我不清楚是mitie本身就没有添加额外特征的功能还是python版没提供这个接口,请问你知道吗?

https://github.com/mit-nlp/MITIE/blob/master/examples/python/train_ner.py#L1 这个是mitie的官方示例,里面就是只有词和词的索引作为训练数据,应该不是rasa没集成的原因。 那我再仔细研究下mitie吧

@Dr-Kevin-Zhang 我是用的最新的授权文件,Data目录和Data/DeepClassifier目录下都放了最新的deepclassifier.user文件