Eric
Results
2
comments of
Eric
第五章 式(5.2) 中最后推导梯度的时候,\hat(yi)也应该是关于w的函数,没有对其求导,直接当成常数处理了,这似乎是不正确的。 \hat(yi)应该是阶越函数的输出,而阶越函数不可导,也没有subgradient,30页直接将\hat(yi)写入了求导的结果,似乎是不正确的。
> @wanyixue 同学你好,损失函数L是关于w和theta的函数,只有w和theta是未知的变量,\hat(yi)和yi都是已知量,所以不用对他们求导,因此也不存在不可导一说 \hat(yi)也是关于w和theta的函数,\hat(yi)=epsilon(w^T+b),也是预测出的吧,怎么能当已知量?