table-ocr
table-ocr copied to clipboard
关于模型训练方法
你好,我正在做一项相似的研究,恰好看到了您的项目,但是在项目中没有发现训练模型的方法,不知是否方便提供模型训练方法,感激不尽。我的邮箱是[email protected]
darknet已经实现了图像语义分割,具体可参考darknet项目下的segmenter.c文件。本项目就参照其实现了UNET,表格横线作为一类,竖线作为一类,然后用logistic作为损失函数。标注数据如下图所示:
可用labelme软件进行line标注或者爬取含有表格的网页转PDF文档,然后对PDF提取表格后,进行训练。
你好,如果是三线表该如何解决哪,同样的标注数据集方法吗 @wenlihaoyu
@wenlihaoyu 请问会公开训练代码和数据集吗?
请问训练集的mask图如何制作呢,代码还需要其他修改吗,训练集样例及训练代码作者能否提供一下,非常感谢,我的邮箱是[email protected],非常期待您的回复
请问训练集的mask图如何制作呢,代码还需要其他修改吗,训练集样例及训练代码作者能否提供一下,非常感谢,我的邮箱是[email protected],非常期待您的回复,网易邮箱,非常感谢您
请问大神,训练集的mask图如何制作呢,训练集样例及训练代码作者能否提供一下,我的邮箱是[email protected],非常感谢您啊。 @wenlihaoyu
同求大神,请问数据集是怎么制作成的,或者可否将大神的数据集发给小弟参考参考,感激不尽!邮箱是[email protected]
为什么我自己标注的四种线条的样本2000张,从头训练,其中不可见的横线竖线基本没有分割出来呢,但是训练的时候的准确率又非常高,请问有人也碰到这个问题吗?
TableBank数据集能直接训练吗