robbertLiu

Results 2 comments of robbertLiu

这个问题我当时也发现了,后来考虑了一天才搞懂。 1.我做过一个实验,就是用滑动平均来计算交叉熵,训练的效果几乎为0,准确率在0.09左右几乎不动。 2.后来我反复研究,应该这么去解释:滑动平均会儿对变量创建所谓的影子变量,而你在进行BP,是对变量进行更新,故在inference计算交叉熵的时候,用变量。当时你在预测的时候,因为用了滑动平均的优化方法,需要对真实的变量进行滑动平均取值,故在inference也就是评价accuracy时,用滑动平均的inference。

这个我真没有,因为没办法提交,我是旁听的,没有提交资格