ocr.pytorch icon indicating copy to clipboard operation
ocr.pytorch copied to clipboard

关于自己数据的训练问题

Open 897486562 opened this issue 5 years ago • 8 comments

作者你好,在使用您的CTPN网络训练自己的数据的时候出现了一些问题 1.加载预训练模型对自己标注的数据进行训练后,检测效果反而变差了 2.训练CTPN时,出现了loss值不下降的情况 3.输入的图片是需要一定的尺度缩放吗 希望能得到解答

897486562 avatar Jan 16 '20 04:01 897486562

1 (1)

897486562 avatar Jan 16 '20 04:01 897486562

这是我的训练数据,使用预训练模型并不能检测到年月日三个字,自己标注训练后,之前能检测的到的数字反而检测不到了

897486562 avatar Jan 16 '20 04:01 897486562

你的数据量有多少啊,我怀疑你的数据如果不够的话可能会欠拟合, 输入图片可以不做调整 一个建议是如果数据比较少的话可以和其他公开数据集一起训练提升泛化性

courao avatar Jan 16 '20 05:01 courao

谢谢您的回答

------------------ 原始邮件 ------------------ 发件人: "唐董琦"<[email protected]>; 发送时间: 2020年1月16日(星期四) 中午1:40 收件人: "courao/ocr.pytorch"<[email protected]>; 抄送: "。。"<[email protected]>;"Author"<[email protected]>; 主题: Re: [courao/ocr.pytorch] 关于自己数据的训练问题 (#20)

你的数据量有多少啊,我怀疑你的数据如果不够的话可能会欠拟合, 输入图片可以不做调整 一个建议是如果数据比较少的话可以和其他公开数据集一起训练提升泛化性

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub, or unsubscribe.

897486562 avatar Jan 16 '20 05:01 897486562

0 1 您好 经过了一些修改 现在loss值可以收敛了
现在对于上图中的“年”字检测不到的问题,您有什么建议呢,是否此模型对于单字符检测不是很准确?

897486562 avatar Jan 16 '20 08:01 897486562

嗯确实会有这样的问题,解决方案是增加一些单独字符的样例提升泛华性能

courao avatar Jan 17 '20 07:01 courao

0 1 您好 经过了一些修改 现在loss值可以收敛了 现在对于上图中的“年”字检测不到的问题,您有什么建议呢,是否此模型对于单字符检测不是很准确?

请问您进行了什么修改使loss下降了呢

zty8599 avatar May 03 '20 09:05 zty8599

Hey @courao @897486562 @zty8599 can you please tell me what is the correct format of training dataset? Atleast, can you please drop the link to original dataset so that I can figure out how the original format looks like.

Thanks, Rahul

rahulct-commits avatar Nov 22 '20 13:11 rahulct-commits