TableMASTER-mmocr icon indicating copy to clipboard operation
TableMASTER-mmocr copied to clipboard

表格结构识别精度

Open Letdreamfly opened this issue 2 years ago • 2 comments

截屏2022-08-16 下午4 01 23 如上图所示,为什么表格结构识别精度在78%左右,这么低的表格结构识别精度是怎么做到Teds在96%的?

Letdreamfly avatar Aug 16 '22 08:08 Letdreamfly

我们报告的这个是表格序列预测的准确性, 这个指标比较严格,要求序列全对才是对,否则纠错,有些结构的序列长度会是300-500个token, 一个都不错不是很容易的事情,78%的准确率其实是不低的,我大致记得,结构序列准确性只有60%多一点, 最后的ted都有可能达到96%,Teds是一个很松的指标,跟它的计算方式有关。即使结构序列错了一个token, 可能这张图的Teds也可以达到97%以上。。

delveintodetail avatar Aug 17 '22 11:08 delveintodetail

我们报告的这个是表格序列预测的准确性, 这个指标比较严格,要求序列全对才是对,否则纠错,有些结构的序列长度会是300-500个token, 一个都不错不是很容易的事情,78%的准确率其实是不低的,我大致记得,结构序列准确性只有60%多一点, 最后的ted都有可能达到96%,Teds是一个很松的指标,跟它的计算方式有关。即使结构序列错了一个token, 可能这张图的Teds也可以达到97%以上。。

明白了,感谢回复~

Letdreamfly avatar Aug 17 '22 11:08 Letdreamfly