table-ocr icon indicating copy to clipboard operation
table-ocr copied to clipboard

关于模型训练方法

Open DLbury opened this issue 4 years ago • 11 comments

你好,我正在做一项相似的研究,恰好看到了您的项目,但是在项目中没有发现训练模型的方法,不知是否方便提供模型训练方法,感激不尽。我的邮箱是[email protected]

DLbury avatar Dec 25 '19 06:12 DLbury

darknet已经实现了图像语义分割,具体可参考darknet项目下的segmenter.c文件。本项目就参照其实现了UNET,表格横线作为一类,竖线作为一类,然后用logistic作为损失函数。标注数据如下图所示:

wenlihaoyu avatar Dec 25 '19 16:12 wenlihaoyu

可用labelme软件进行line标注或者爬取含有表格的网页转PDF文档,然后对PDF提取表格后,进行训练。

wenlihaoyu avatar Dec 25 '19 16:12 wenlihaoyu

image

wenlihaoyu avatar Dec 25 '19 16:12 wenlihaoyu

你好,如果是三线表该如何解决哪,同样的标注数据集方法吗 @wenlihaoyu

ZF1546 avatar Jan 16 '20 06:01 ZF1546

@wenlihaoyu 请问会公开训练代码和数据集吗?

Springzcf avatar Apr 13 '20 11:04 Springzcf

请问训练集的mask图如何制作呢,代码还需要其他修改吗,训练集样例及训练代码作者能否提供一下,非常感谢,我的邮箱是[email protected],非常期待您的回复

zdmwang avatar Jun 12 '20 02:06 zdmwang

请问训练集的mask图如何制作呢,代码还需要其他修改吗,训练集样例及训练代码作者能否提供一下,非常感谢,我的邮箱是[email protected],非常期待您的回复,网易邮箱,非常感谢您

zdmwang avatar Jun 15 '20 06:06 zdmwang

请问大神,训练集的mask图如何制作呢,训练集样例及训练代码作者能否提供一下,我的邮箱是[email protected],非常感谢您啊。 @wenlihaoyu

wuxiaolianggit avatar Aug 28 '20 01:08 wuxiaolianggit

同求大神,请问数据集是怎么制作成的,或者可否将大神的数据集发给小弟参考参考,感激不尽!邮箱是[email protected]

huabao97 avatar Nov 11 '20 13:11 huabao97

为什么我自己标注的四种线条的样本2000张,从头训练,其中不可见的横线竖线基本没有分割出来呢,但是训练的时候的准确率又非常高,请问有人也碰到这个问题吗?

pingzi5233 avatar Nov 12 '20 09:11 pingzi5233

TableBank数据集能直接训练吗

Barry1915 avatar May 08 '23 11:05 Barry1915