pytorch_triple_extraction icon indicating copy to clipboard operation
pytorch_triple_extraction copied to clipboard

基于pytorch的中文三元组提取(命名实体识别+关系抽取)

Results 8 pytorch_triple_extraction issues
Sort by recently updated
recently updated
newest added

在训练关系抽取的时候会出现list index out of range问题,想问一下,这个要从哪里去解决呢,我不太清楚这个list是从哪里传过来的

![屏幕截图 2022-10-15 010322](https://user-images.githubusercontent.com/101809034/195902382-5adc11c0-4cb9-40ba-9930-0e4bace6e249.png) chinese-bert-wwm-ext与chinese-roberta-wwm-ext里面的文件是一样的吗?我看他们的大小都相同。

作者您好! 我刚刚接触知识图谱不久,非常感谢您的详细注释和方案解析可以让我对相关知识了解更多。 通过您的方法可以构建出"实体1-关系-实体2"的三元组,我想增加"实体-属性-属性值"的三元组。想请教您,这个问题通过您的模型可以解决吗? 或者麻烦您可以提供一个大概思路吗?

类似于项目里面的train.json文件里面的那样,能标注出三元组

作者您好,您的项目对我有很大的帮助,但是关于NER模型高层部分构成的目的我有一些问题想要请教您。 首先下图是模型高层部分的构成图: ![image](https://github.com/taishan1994/pytorch_triple_extraction/assets/83754033/b7952072-7261-4ffd-a064-870ab7c9f70a) 其中最后线性分类器的输出维度和CRF部分的tag数量我根据自己任务进行了更改,但这不会影响到我下面的问题。 我的问题是: 1、中间线性层中为何首先将768降维到256?256这个数字是通过什么方式得到的? 2、后续的ReLU激活函数的目的又是什么? 3、在模型真正实现的过程中dropout操作并没有真正采用,原因是否是因为在中间线性层中已经进行过了dropout? 期待您拨冗回复!

麻烦作者了,我在训练的时候,step到310的时候,调用utils.py里面的sequence_padding()函数时,为什么input是空列表,求解答 ![5EED(9 OB125L%@5$NA{K07](https://user-images.githubusercontent.com/52553428/231337198-65b40deb-cd93-4556-8839-4e59ecc5ccca.png)

作者您好!作为一个知识图谱初学者,非常感谢您这项工作,让我获益颇多。 在进行关系抽取步骤时,我注意到您将句子中的每个实体两两组合,若不是同一个三元组则将其标注为未知,这样的预处理为模型输入带来了很多标签为“未知”的数据,同时很大的增大了数据量。请问若仅将原始数据中的三元组预处理,而不新增“未知”的关系类型,这与您现在采用方法相比,会对模型结果带来很大改变吗?

你好,在训练时最后出现数组append的时候,前后数组不一致 想问一下,实体识别为什么会出现这个问题呢