chinese_ocr icon indicating copy to clipboard operation
chinese_ocr copied to clipboard

训练数据是否必须有良好语义??

Open hello2sys opened this issue 5 years ago • 6 comments

我利用了7000多中文字符生成了大量的长度为10个字的图片,其中的文字是随机组合的,不像作者给的数据集那样具有语义,我觉得这种CNN结构的网络应该不用考虑上下文关系的吧,不知道理解有没有偏差。。

hello2sys avatar Jul 23 '19 01:07 hello2sys

不用

jewelcai avatar Jul 30 '19 05:07 jewelcai

我利用了7000多中文字符生成了大量的长度为10个字的图片,其中的文字是随机组合的,不像作者给的数据集那样具有语义,我觉得这种CNN结构的网络应该不用考虑上下文关系的吧,不知道理解有没有偏差。。

能行吗

ql106 avatar Aug 16 '19 11:08 ql106

我利用了7000多中文字符生成了大量的长度为10个字的图片,其中的文字是随机组合的,不像作者给的数据集那样具有语义,我觉得这种CNN结构的网络应该不用考虑上下文关系的吧,不知道理解有没有偏差。。

能行吗

能行

jewelcai avatar Aug 19 '19 00:08 jewelcai

我训练的时候loss比较大还下不去,acc也为0,数据集你们是怎么做的,能分享一下吗

ql106 avatar Aug 19 '19 01:08 ql106

@hello2sys 不需要。比如训练集全是数字,能有什么语义信息?

xiaocmxiao avatar Dec 31 '19 02:12 xiaocmxiao

我训练的时候loss比较大还下不去,acc也为0,数据集你们是怎么做的,能分享一下吗

老哥你解决这个问题了吗。我也是这个问题,都快崩溃了

shining-love avatar Jun 21 '20 11:06 shining-love