CasRel icon indicating copy to clipboard operation
CasRel copied to clipboard

extract_items中预测实体边界问题

Open yuenoble opened this issue 5 years ago • 8 comments

模型中subject_model和object_model预测的实体结尾tail的位置,就是实体结尾那个字的索引,但是在extract_items中,模型预测位置后,选择实体的时候使用的是:subject = tokens[sub_head: sub_tail]和obj = tokens[obj_head: obj_tail],这样选择的话,实体的最后一个字符不是没有选到结果里面吗?是不是应该用subject = tokens[sub_head: sub_tail+1]和obj = tokens[obj_head: obj_tail+1]

yuenoble avatar Oct 26 '20 09:10 yuenoble

模型中subject_model和object_model预测的实体结尾tail的位置,就是实体结尾那个字的索引,但是在extract_items中,模型预测位置后,选择实体的时候使用的是:subject = tokens[sub_head: sub_tail]和obj = tokens[obj_head: obj_tail],这样选择的话,实体的最后一个字符不是没有选到结果里面吗?是不是应该用subject = tokens[sub_head: sub_tail+1]和obj = tokens[obj_head: obj_tail+1]

不用加一,没有取的那个位置实际上是[unused]这个特殊token

ItGirls avatar Nov 13 '20 08:11 ItGirls

请问为什么不用加一呢 没有取出的那个位子为什么会是【unused】呢 实体尾的位置不应该是实体尾所在的字符吗

wangzemin63 avatar May 20 '21 02:05 wangzemin63

请问,您训练一轮webnlg数据集时间要多久?

XTJM avatar Nov 30 '21 14:11 XTJM

请问,您训练一轮webnlg数据集时间要多久?

是在问我吗,不好意思,我没有用这个模型来训练过这个数据

ItGirls avatar Dec 03 '21 08:12 ItGirls

请问,您训练一轮webnlg数据集时间要多久?

我跑了一份NYT的数据集,一个epoch20分钟左右 2e2fa945a3739bfe1e6eea1144e5c5a

WangYao-GoGoGo avatar Dec 07 '21 16:12 WangYao-GoGoGo

请问,您训练一轮webnlg数据集时间要多久?

我跑了一份NYT的数据集,一个epoch20分钟左右 2e2fa945a3739bfe1e6eea1144e5c5a

大佬, 运行run.py文件时报错,显示无法找到该文件,saved_weights/NYT/best_model.weights',请问best_model.weights文件是如何生成的

32209056 avatar Oct 29 '23 10:10 32209056

亲,你跑的测试?训练完以后就会生成模型参数。作者应该有传训练好的模型,你下载以后加载一下

WangYao-GoGoGo avatar Oct 29 '23 11:10 WangYao-GoGoGo

亲,你跑的测试?训练完以后就会生成模型参数。作者应该有传训练好的模型,你下载以后加载一下

只有一个run文件啊,这一步python run.py --train-True --dataset=NYT 没有生成best_model.weights啊

32209056 avatar Oct 29 '23 12:10 32209056