Rasa_NLU_Chi icon indicating copy to clipboard operation
Rasa_NLU_Chi copied to clipboard

能否添加look up table 在中文下的应用

Open yijinsheng opened this issue 5 years ago • 8 comments

yijinsheng avatar Jul 01 '19 03:07 yijinsheng

这应该是自己在rasa的训练文件里面指定的吧,rasa官网有教程

pengyou200902 avatar Jul 22 '19 15:07 pengyou200902

今天自己试了下,lookup table没起作用,还在找原因中,不知 @sdu-2044 有没有找到办法

pengyou200902 avatar Jul 23 '19 05:07 pengyou200902

确实我在 docker 里面运行 rasa lookup table 也不起作用

rxy1212 avatar Oct 18 '19 07:10 rxy1212

@rxy1212 @pengyou200902抱歉,刚看到 ,仔细阅读源码,regex_featurizer.py里面有这么一行代码 regex_string = "(?i)(\b" + "\b|\b".join(elements_sanitized) + "\b)",意思是说把lookup里面的所有词组成一个正则。但是rasa官方在正则里面加了\b,这是一个字符边界符号。我们知道英文中单词之间是用空格分开的,那么中文呢,显然没有。两位去掉之后再试试。

yijinsheng avatar Oct 18 '19 09:10 yijinsheng

今天试了一下加入lookup table,好像确实没有作用,请问有什么解决方法吗

yangjianxin1 avatar Oct 21 '19 13:10 yangjianxin1

@sdu-2044 你好,请问一下你说的那个方法可行吗

yangjianxin1 avatar Oct 21 '19 14:10 yangjianxin1

@yangjianxin1 我试过,可以

yijinsheng avatar Oct 23 '19 06:10 yijinsheng

@sdu-2044 我对特定领域的实体构造了字典树,识别效率挺好的,感觉可以不用lookup table

yangjianxin1 avatar Oct 25 '19 11:10 yangjianxin1