joint-mrc icon indicating copy to clipboard operation
joint-mrc copied to clipboard

数字类answer效果不好

Open FankLi opened this issue 4 years ago • 1 comments

你好,麻烦请教一下,用了你的架构在自己数据集上进行了训练,但是数据类的answer效果很不好,acc不到50%,请问会是什么原因造成的呢?

例子: context:'2020.10.18的贷款利率是5.88%,这是最新的利率...',question:'贷款利率是多少?',answer:'5.88%'

模型预测的答案虽然是数字,但不是5.88%,结果可能是2020,可能是18,等等

是因为tokenizer.tokenize把5.88%分开了吗?但是answer_start是在5上,answer_end是在%上

FankLi avatar Oct 18 '20 07:10 FankLi

误删了上一个issues...

FankLi avatar Oct 20 '20 06:10 FankLi