JioNLP icon indicating copy to clipboard operation
JioNLP copied to clipboard

中文 NLP 预处理、解析工具包,准确、高效、易用 A Chinese NLP Preprocessing & Parsing Package www.jionlp.com

Results 42 JioNLP issues
Sort by recently updated
recently updated
newest added

一日,偶然发现JioNLP的时空解析功能十分符合我的研究内容 于是将其用于项目中的时空标准化模块,实验发现具有不错的效果 这促进了我作为本科生发出了人生第一篇属于自己的SCI,十分感谢dongrixinyu做出的贡献 论文链接:https://www.mdpi.com/2220-9964/12/9/368 (于本文对JioNLP仓库进行引用)

jionlp.ner.extract_time("每天早上八点,他去上学", time_base=time.time())解析正确 jionlp.ner.extract_time("每天早上八点,他去上学", time_base=time.time())解析错误 [{'time_candidate': '每天早上八点,', 'offset': [0, 7]}] 2023-08-28 12:19:43 ERROR parse_time_period: Traceback (most recent call last): File "/home/stardust/anaconda3/envs/rasa/lib/python3.10/site-packages/jionlp/gadget/time_parser.py", line 1209, in parse_time_period first_full_time_handler, second_full_time_handler, _, blur_time = self.parse_time_span_point(...

bug

不同的项目中有不同的停用词。直接更改stopwords.txt 有些乱。添加用户自定义的停用词的stopwords_loader

不知道这个“语言学习”能力算不算在你的‘大语言模型对人类用户的辅助能力“之内。如果可以算得上,我可以整理几个出来。 背景信息如下:我用AI练一些法语,结果发现CLAUDE和chatGPT都会出现一些常识性的错误。 比如: 我:j'ai besoin de continuer sur le même point. Mais expliquez-moi la utilisé du dont avant. AI: D'accord, continuons sur les pronoms relatifs. Je vais d'abord vous expliquer...

**时间识别错误** 1. 版本(Version):1.4.35 2. jionlp的调用代码与输入文本(Code & Text): import jionlp as jio time_list = ['此刻','当前','这个月'] for t_str in time_list: try: res = jio.parse_time(t_str) print(res) except: print(t_str) 3. 调用报错日志如下(Log): trackback: ValueError: can...

bug

行政区划变更的数据不太全,只记录了2018年以来的变更信息,事实上,1999年到2017年发生行政变更的非常多呢,而且会有同一个地方他在不同年份都有修改。举个例子,比如,调用的时候输入“上海市闸北区9000弄”,这种就不包含正确的区县变更信息,请楼主在百忙中能够进一步补全,非常感谢! 另外看到最近3天,楼主补充了行政区划变更年份信息,新增了2002年,2010年两年的,应该不止哦

**描述该功能的用处,可以提供相关资料描述该功能** 除了汉字拆解,如果能反向提供一个汉字合并的功能就好了 **该功能是否用于改进项目缺陷,如果是,请描述现有缺陷** 没有缺陷,感谢大佬付出 **描述你期望实现该功能的方式和最终效果** 和拆解相反,合并两个汉字为一个 **请顺手 star 一下右上角的⭐小星星** 手工点了一万遍,哈哈

语言识别有点点问题,问最近一次年报别识别成了“次年”,准确的拆词应该是"最近一次", "年报"。 如: “特斯拉最近一次年报的股东权益是多少?” 1. 版本(Version): - python 版本: 3.10.5 - jionlp 版本: 1.4.35 2. jionlp的调用代码与输入文本(Code & Text): ``` import time import json import jionlp as jio res = jio.ner.extract_time('特斯拉最近一次年报的股东权益是多少?',...

bug

时间解析的节日范围时间段:“去年国庆期间” 应当返回时间段,而非时间点,五一期间,十一期间同理。 **请顺手 star 一下右上角的⭐小星星**

bug