pyltp icon indicating copy to clipboard operation
pyltp copied to clipboard

pyltp: the python extension for LTP

Results 15 pyltp issues
Sort by recently updated
recently updated
newest added

## 问题类型 疑似内存泄漏 ## 出错场景 我们对经过预处理(去重、去除特殊符号、分句)之后的一系列句子调用pyltp的接口进行分析。分词、词性标注、依存句法分析和命名实体识别这四部分运行未见异常,但是调用语义角色标注功能会导致python程序占用内存大幅度且持续增加,我们判断这里可能存在python内存泄漏。更换语料或是python版本,问题均存在。 ## 如何复现这一问题 连续对数百个句子进行语义角色标注即会遇到上述内存占用大幅度增加的问题。 ## 运行环境 ubuntu 16.04 LTS python3.6.3 pyltp版本 0.2.1 模型版本 3.4.0 ## 期望结果 请开发者确认这个问题(语义角色标注时占用内存剧增)是否是内存泄漏。非常感谢!

环境pyhton3.6,pyltp0.4.0: ![image](https://github.com/HIT-SCIR/pyltp/assets/61353633/c6d5e9ba-a7fb-4b28-973c-f6012755b897) 运行[example.py](https://github.com/HIT-SCIR/pyltp/blob/master/example/example.py)文件,输出结果如下,报如下错误: ![image](https://github.com/HIT-SCIR/pyltp/assets/61353633/e88b15a8-2e93-46d1-b392-32dd9241e2ee)

目前使用 pyltp 模块 根据词性删除标点符号与助动词 得到的结果 都保存在一个列表中,能不能 直接 按照 每段每句的格式返回 ? 这样省去使用者再去 写这方面的代码. 为了能按照文章不同段落以及不同句子来保存文本, 我使用了多个的动态变量保存迭代结果, 一个短短 27行大小27k 的文本运行了将近半个小时&内存峰值达到30G 如果是更大的文本 可能造成内存不足 如果 在模块端优化 能使使用者更加便利

win11,python3.8,模型与pyltp都是最新版, arc这个元组没有head属性,cdsn上很多人都有这个问题

在提问之前,请确认以下几点: - [ ] 如果您对算法或C++实现有问题,请在https://github.com/HIT-SCIR/ltp/issues提问 - [ ] 由于您的问题可能与前任问题重复,在提交issue前,请您确认您已经搜索过之前的问题 ## 问题*类型* ## 出错*场景* ## 代码片段 ## 如何复现这一错误 ## 运行环境 ## 期望结果 ## 其他 Please ensure your issue adheres to the...

在windows server 2012R2的服务器上,64位操作系统 1、直接安装的 pyltp-0.4.0-cp36-cp36m-win_amd64.whl 和 pyltp-0.4.0-cp37-cp37m-win_amd64.whl 时报错; 2、本地电脑安装创建虚拟环境并安装相关包,本地电脑能成功运行,压缩虚拟环境,拷到服务器上再解压后import,都报相同的错误: ![image](https://github.com/HIT-SCIR/pyltp/assets/69330046/314235bf-05c1-44ec-b573-e2e94e16bc15)

## 问题*类型* 词典功能 ## 期望结果 做命名实体识别任务。 目前可以从文件读取词典和词性,但是因为项目要求,需要做好几轮识别。 每完成一轮识别,需要on-the-fly模式读取读取上一轮识别出来的词典, 这个功能可以实现吗?或者有其他方法可以绕开读取词典?

feature want

文件中無增添停用詞功能,請問有加這個功能進去嗎?

feature want

请问代码输出的mDunc是什么意思? 我在下面的列表中查不到 http://www.ltp-cloud.com/intro#dp_how 使用的代码是: https://paste.ubuntu.com/p/k9zXTzCf3h/ 数据集data.csv格式如下: comment 《连城诀》第1章去掉换行符 《连城诀》第2章去掉换行符

看到两年前有人提这个问题说当时不支持,但是在语言云平台上看到说“用户可以很容易将实体类型拓展成品牌名、软件名等实体类型”,所以现在是支持了吗,要怎么做呢?