TPlinker-joint-extraction icon indicating copy to clipboard operation
TPlinker-joint-extraction copied to clipboard

tok_span问题

Open kanhuimin opened this issue 3 years ago • 5 comments

您好,非常感兴趣您的工作,并尝试调试了一下,我用的百度关系数据集,并在BuildData时遇到了一些问题,出现了IndexError: list index out of range的问题,具体如下 image bi您知道是什么原因造成的吗?非常感谢!

kanhuimin avatar Sep 27 '21 07:09 kanhuimin

我今天出现了这个问题,在第4728/5684条数据处出错了,后来我把这一条数据删掉,问题解决。 猜测是,这条数据本身的错误,要么是本身char_span出错了,要么是去计算token_span的时候出错了,总之你可以尝试删掉这一条试一下。 你的前30%没错,说明前边的数据还是没问题的。

Jason7even avatar Nov 11 '21 06:11 Jason7even

这种情况就直接在出错那行代码打断点查

131250208 avatar Nov 12 '21 13:11 131250208

我也想问一下大佬这是什么问题

lelechallc avatar Mar 08 '22 07:03 lelechallc

您好,我已经收到您的邮件,祝生活愉快。

Jason7even avatar Mar 08 '22 07:03 Jason7even

我也遇到过类似的,原因是我在数据标注的时候不小心将空格' '也标注进去了,导致token方面最后index出现了-1。case可能不太一样,仅供参考

YaleFeng avatar May 23 '23 01:05 YaleFeng