pumpkin-book icon indicating copy to clipboard operation
pumpkin-book copied to clipboard

【第11章特征选择与稀疏学习】待推导或待解析公式征集+答疑专区

Open Sm1les opened this issue 4 years ago • 17 comments

在这里,你可以: 1.评论留下西瓜书第11章你觉得需要补充推导细节或者解析的公式编号,我们看到后会尽快进行补充; 2.评论留下你对南瓜书第11章里相关内容的疑问,我们看到后会尽快进行答疑。

Sm1les avatar Jul 25 '19 02:07 Sm1les

第11章11.18的推导中,对bj*aj的展开感觉有误,bj展开j后我觉得是下标表示第j列吧

BladeLee6913 avatar Aug 11 '19 07:08 BladeLee6913

第11章11.18的推导中,对bj*aj的展开感觉有误,bj展开j后我觉得是下标表示第j列吧

感谢提醒,应该是上面列向量写错了

feijuan avatar Aug 11 '19 13:08 feijuan

您好,关于11.9,李普希茨连续条件为|f(x1)-f(x2)|≤L|x1-x2|,请问如何从这个公式得到公式11.9啊,不吝赐教。

yanglei-github avatar Sep 25 '19 15:09 yanglei-github

@yanglei-github 同学你好,西瓜书里面的公式11.9应该是写错了,因为按照lipschitz-continuous的定义来看的话,公式11.9里面的L2范数的平方是应该去掉平方项的。

Sm1les avatar Sep 26 '19 00:09 Sm1les

@yanglei-github 同学你好,西瓜书里面的公式11.9应该是写错了,因为按照lipschitz-continuous的定义来看的话,公式11.9里面的L2范数的平方是应该去掉平方项的。

您好,如果是这样的话我觉得平方项去掉后等式左边也不应该对函数求梯度,所以我在想是否11.9不是指lipschitz-continuous的定义,而是为了使二阶泰勒展示可以成功应用的充分条件

yanglei-github avatar Sep 27 '19 08:09 yanglei-github

您好,关于公式11.13,x(k+1)=0的情况为什么就是极小值,另外为什么x(k+1)不能取大于0,也不能取小于0时,一定是等于0?

yanglei-github avatar Oct 22 '19 09:10 yanglei-github

第11.6部分的公司推导能否介绍一下? 11.22-11.26 看不太懂 谢谢!

luisxxx avatar Feb 27 '20 16:02 luisxxx

@luisxxx 您好,11.6节介绍的压缩感知在西瓜书中属于概念性的介绍,类似于罗列定理,建议查阅压缩感知相关的资料了解。这部分内容目前不准备在南瓜书中展开。

archwalker avatar Feb 28 '20 10:02 archwalker

您好,关于公式11.13,x(k+1)=0的情况为什么就是极小值,另外为什么x(k+1)不能取大于0,也不能取小于0时,一定是等于0?

@yanglei-github 您好,这部分公式我进行了重新推导,应该可以解答您的问题了。

archwalker avatar Feb 28 '20 10:02 archwalker

您好,关于11.9,李普希茨连续条件为|f(x1)-f(x2)|≤L|x1-x2|,请问如何从这个公式得到公式11.9啊,不吝赐教。

@yanglei-github 您好,看起来这边确实是西瓜书的笔误,我按照ipschitz-continuous 的定义式进行了推导,请查阅

archwalker avatar Feb 28 '20 10:02 archwalker

您好,11.10中维基百科的利普希茨条件的定义应当是距离,一般是二范数。原书上的写法无误,另外泰勒展开式里面二阶项应当是一个二次型,海塞矩阵,可以由利普希茨条件得到二次型小于L|y-x|^2

Pu275 avatar May 12 '20 17:05 Pu275

您好,11.10中维基百科的利普希茨条件的定义应当是距离,一般是二范数。原书上的写法无误,另外泰勒展开式里面二阶项应当是一个二次型,海塞矩阵,可以由利普希茨条件得到二次型小于L|y-x|^2

您好,这是一个非常好的问题,我的想法是这样的:

  1. 关于距离,如果利普希茨条件的定义是距离,一般是二范数,那么周老师书上是二范数的平方,也有一点点小问题,所以不如按照 wiki 的写法,写成模糊的距离定义。
  2. 关于二次型,您的说法是正确的,泰勒展开那里确有形式上的不严谨之处,不过那里的泰勒展开是直接引用公式 11.10 第一行的形式给出的,所以没有细究形式。如果您有更好的推导和形式上的修复,欢迎提 pr 给我。

archwalker avatar May 13 '20 02:05 archwalker

您好,发现一个小小的笔误吧应该是。公式11.10里面,“在wiki百科的定义中,式11.7应该写成...”这句话里面的式11.7应该是11.9吧

lizoe avatar Aug 07 '20 03:08 lizoe

您好,发现一个小小的笔误吧应该是。公式11.10里面,“在wiki百科的定义中,式11.7应该写成...”这句话里面的式11.7应该是11.9吧

您好,是的,已修正,谢谢!

archwalker avatar Aug 07 '20 04:08 archwalker

您好,公式11.14分情况讨论中的4.的a.,“a.当|z^i|>λ/L时,最小值在x^i=z^i-λ/L处取得”,这里|z^i|>λ/L分为z^i>λ/L和z^i<-λ/L两种情况,为什么可以直接说最小在x^i=z^i-λ/L?虽然最后的结论都一样,但这里这句话的最小不能理解,望不吝赐教,谢谢

lizoe avatar Aug 08 '20 01:08 lizoe

您好,公式11.14分情况讨论中的4.的a.,“a.当|z^i|>λ/L时,最小值在x^i=z^i-λ/L处取得”,这里|z^i|>λ/L分为z^i>λ/L和z^i<-λ/L两种情况,为什么可以直接说最小在x^i=z^i-λ/L?虽然最后的结论都一样,但这里这句话的最小不能理解,望不吝赐教,谢谢

您好,这里的逻辑是这样的,当|z^i|>λ/L时,函数g(x_i=0)=\frac{L}{2}z^i^2 这个式子因为平方项的缘故,所以不管哪一种情况都是成立的。然后只要随便取一种情况(解析中取的是x^i=z^i-λ/L)证明这个式子不是g(x)的最小值即可。

archwalker avatar Aug 11 '20 03:08 archwalker

image-20211024120852987 您好。对于南瓜书上这段话,。根据上下文,alpha的下标 i 应该表示的是样本,而 u 和 v 则是词汇稀疏表示。这样看来,“没有样本之间的交互”我认为有失偏颇,因为它们(alpha^u和alpha^v)都在同一个样本 i 上。

liyipeng00 avatar Oct 24 '21 04:10 liyipeng00