ltp
ltp copied to clipboard
Language Technology Platform
这个问题怎么解决啊
我想训练一个实体识别的模型,我看见有issue中提到直接运行task_named_entity_recognition.py文件即可。 我运行后直接就报导包错误。我尝试回退版本也不行。 是程序的bug。还是说需要需要在run configuration中配置一些参数。
如何使用tener 进行训练
LTP中分词结果返回分词列表和hidden两个值,后续的词性标注和语法分析等等操作都基于hidden,请问hidden的具体含义可以在哪里找到呢?
python3.7, ltp4.1.5.post2
ltp进行批处理时,会占满所有cpu核,怎么在ltp内部通过参数控制单进程
python 中的ltp包分词不准,如何解决呢? 比如对于“客厅的房顶上有一盏银色的大吊灯”这一句话,在LTP平台上的分词结果为[客厅 的 房顶 上 有 一 盏 银色 的 大 吊灯],而在python语言中调用ltp包或者pyltp包的分词结果为[客厅 的 房顶 上 有 一 盏 银色 的 大吊灯].还有很多类似的例子.请问这有什么解决的办法吗?
最近在做事件抽取的任务,发现很多项目都是用pyltp写的,用ltp4重写方法的时候找不到pyltp输出结果,可以出一个教程么
实际结果都是如大写AGT、FEAT等,跟官网的对应不上,请问有没有基于官网标注系统的模型或参数?
当我使用用户自定义词典时,由于自定义词汇不再分词,其词性由LTP判定会产生大量错误。 例如机械领域表达零件名称的词汇: 支撑组件 、清洁组件、辅助传动组件。 这些词汇如果由LTP自动确定词性会根它的某一部分被识别为动词、形容词等。 这些我应该定义成专有名词,可能是因为LTP没有将用户词典的词性理解正确,导致后续的语义依存、语义角色标准均存在问题。   图中所有的机械零件名称应被定义为专有名词,可被识别成了其他词性。 但如果可以自定义他们的词性是不是就可以解决这个问题。 因此,希望作者可以开放此部分功能。