cnn_handwritten_chinese_recognition icon indicating copy to clipboard operation
cnn_handwritten_chinese_recognition copied to clipboard

算法重新训练不收敛

Open aliendaniel opened this issue 5 years ago • 2 comments

@taosir 您好,我用分别用tf2 keras、paddlepaddle、pytorch重新复现了您的算法,用hwdb1.1数据训练模型,图像处理的过程为取灰度,resize到(64,64,1),标准化到01区间,发现均不收敛loss始终在8.2左右,可否告知下训练前是否对图像做了其它的调整。

aliendaniel avatar Dec 10 '19 05:12 aliendaniel

没有做特别的处理,只是一些简单的图片旋转,缩放,亮度变化。 不收敛的话考虑一下: 1、数据做归一化 2、忘了做数据预处理。忘了使用正则化 3、Batch Size设的太大。学习率设的不对 4、最后一层的激活函数用的不对 5、梯度爆炸 6、参数初始化调整 7、网络太深 8、隐藏层神经元数量调整

taosir avatar Dec 11 '19 12:12 taosir

@aliendaniel 您好,请问您目前问题解决了吗?我也出现了同样的问题,loss在8.2左右不下降,如果您已经解决,麻烦您说一下问题出在哪儿,谢谢。

gy-hhhh avatar Mar 13 '20 21:03 gy-hhhh