elasticsearch-analysis-ansj
elasticsearch-analysis-ansj copied to clipboard
经过停用词过滤之后。再次调用别的发现器 比如: Result modifResult = DicAnalysis.parse(str,DicLibrary.gets(Dictionary.userDic,DicLibrary.DEFAULT)).recognition(Dictionary.getStopFilter()).recognition(new EmailRecognition()); System.out.println(modifResult); 报错如下: Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 37 at org.ansj.util.Graph.getMaxTerm(Graph.java:174) at org.ansj.util.Graph.rmLittlePath(Graph.java:144) at org.ansj.app.extracting.Extracting.parse(Extracting.java:130) at org.ansj.app.extracting.Extracting.parse(Extracting.java:113) at org.ansj.recognition.impl.EmailRecognition.recognition(EmailRecognition.java:38) at org.ansj.domain.Result.recognition(Result.java:53) at varyag.WordEngine.ansj_analysis(WordEngine.java:54) at...
你好,我在定位问题时发现,本项目提供的刷新辞典接口flush/dic很奇怪,大致描述如下: 1,先调用flush接口,后ES进行查询,此时的结果时正常的 2,在调用flush/dic之前(新词未生效),ES进行了**一次**该词的搜索(结果肯定“错误”),flush使新词生效,后面的ES搜索,结果**时好时坏**(单节点环境,指定主分片) 3,如果在步骤2中的flush之前,进行过**10次**左右的搜索,接着flush使新词生效,后面的ES搜索,结果**都是**新词之前的“错误”结果 感觉像是ES基于搜索有内部的缓存,由于ES还没有了解到这么深,想在这里得到大佬们的支持,谢谢。
我想在搜索到的结果中屏蔽掉某些短语,如搜索"吕布战天下"时,屏蔽掉“战天下”这个短语,结果中允许出现“天下大乱,云长战吕布”,但是不允许“吕布大战天下”。有什么好的解决方案吗?
给 dic配置 jdbc链接 ,加载报错 err 其他的都没有问题 版本 7.6.2
 配置dic:完整路径没有生效 dic_path:目录也没有生效 postgresql数据库也没有生效 请问是什么原因,哪里配置的不对吗
在插件目录下添加了mysql-connector-java-8.0.23.jar,打开了plugin-security.policy的权限,重新启动elasticsearch后报错如下: Likely root cause: java.security.AccessControlException: access denied ("java.security.SecurityPermission" "putProviderProperty.MySQLScramShaSasl") at java.base/java.security.AccessControlContext.checkPermission(AccessControlContext.java:472) at java.base/java.security.AccessController.checkPermission(AccessController.java:1036) at java.base/java.lang.SecurityManager.checkPermission(SecurityManager.java:408) at java.base/java.lang.SecurityManager.checkSecurityAccess(SecurityManager.java:1521) at java.base/java.security.Provider.check(Provider.java:852) at java.base/java.security.Provider.putService(Provider.java:1363) at com.mysql.cj.sasl.ScramShaSaslProvider.lambda$new$0(ScramShaSaslProvider.java:78) at java.base/java.security.AccessController.doPrivileged(AccessController.java:312) at com.mysql.cj.sasl.ScramShaSaslProvider.(ScramShaSaslProvider.java:77) at com.mysql.cj.protocol.a.authentication.AuthenticationLdapSaslClientPlugin.(AuthenticationLdapSaslClientPlugin.java:73) at...
按照readme的方式,配置mysql的方式加载词典报错,找不到路径;请问可以完善下readme,给出一些详细示例,以及说明。
config/elasticsearch-analysis-ansj/ansj.cfg.yml如下  es根目录下 libraries.properties配置如下  config/目录下的ansj_library.properties配置如下:  我的需求是通过postgresql能更新 但是 刷新很多次 测试多次 发现postgresql的词 从来没有作用 请问该怎样解决 可能是哪些问题
使用index_ansj存储,query_ansj搜索 mapping简略配置如下: ``` "analysis": { "analyzer": { "my_analyzer": { "type": "custom", "char_filter": [ "my_char_filter" ], "tokenizer": "index_ansj" } }, "char_filter": { "my_char_filter": { "type": "html_strip" } } }, ``` ```...