zhparser
zhparser copied to clipboard
zhparser is a PostgreSQL extension for full-text search of Chinese language
我在分词搜索的时候发现,搜索内容中必须包含我输出的所有关键词,他才会被select出来。 我希望包含部分关键词的条目也能被搜索出来,比如我搜索“使用引擎”,那么“引擎很不错”也能被搜索。 请问有成功实现的大佬可以指导一下吗?
"健康生活,陪伴有我" 分词成了 "'健康':2 '健康生活':1 '有':5 '生活':3 '陪伴':4" 其中 "'健康" 被重复分词,造成使用ts_headline时文本重复 "健康生活健康生活,陪伴有我"
`https://github.com/amutu/zhparser/blob/master/zhparser.control` Shows default version 2.2 however there is no `zhparser--2.2.sql` I had the issue without providing an extension version when creating it such as : `CREATE EXTENSION zhparser;` however `...
**开发者,您好,我们在PostgreSQL中使用zhparser插件,发现没有按长词优先返回结果,代码和示例如下:** CREATE EXTENSION zhparser; CREATE TEXT SEARCH CONFIGURATION testzhcfg ( PARSER = zhparser ); ALTER TEXT SEARCH CONFIGURATION testzhcfg ADD MAPPING FOR n,v,a,i,e,l WITH SIMPLE; -- 往自定义分词词典里面插入新的分词 INSERT INTO pg_ts_custom_word...
我之前加了不少自定义关键字,但是后来换了一个服务器,我使用 postgres 的 dumpall 备份了数据库,但是我发现,自定义词库并未导入,请问,我该备份并稍后恢复那个文件呢?又或者其他办法?
例如: 我运行了下面的代码。 ``` run "ALTER role all SET zhparser.multi_short=on;" # 1 短词复合 run "ALTER role all SET zhparser.multi_duality=on;" # 2 二元复合 run "ALTER role all SET zhparser.multi_zmain=on;" # 主要单字复合 #...
维护者,您好。 这个 issue 虽然其实不确定是 zhparser 的问题,但是也许你们可以帮忙查找问题在哪里。 请看这个例子。 https://gist.github.com/zw963/212654fc1180d39be1d818392c96bb68 以及这个相关的讨论 https://groups.google.com/g/sequel-talk/c/iVVbSH10X1g
首先这是不加自定义词库时, 返回的结果, 注意看返回的 "感恩“ ```sql psql (13.4) Type "help" for help. marketbet_crawler_development=# select * from zhparser.zhprs_custom_word; word | tf | idf | attr ------+----+-----+------ (0 rows) marketbet_crawler_development=# SELECT ts_parse('zhparser','金市周评:FED加息预期升温且国际贸 易局势缓和,感恩节前金价回落');...
添加字典不起作用
postgres12,zhparser2.1 拿dict_extra.txt作例子,放到tsearch_data目录和base/数据库ID下都不管用。