zhangzhe-excel
因为是minibatch而不是全局batch所以损失值的趋势是有升有降的
现在的损失值为5位数的实际上是一百次循环损失值的累加,把损失值的初始化self.loss=0放置在update()函数之前,损失值就是三位数的水平,与第0次循环数量级是一样的。
用L2范数,代码默认的L1