pumpkin-book icon indicating copy to clipboard operation
pumpkin-book copied to clipboard

【第4章决策树】待推导或待解析公式征集+答疑专区

Open Sm1les opened this issue 4 years ago • 7 comments

在这里,你可以: 1.评论留下西瓜书第4章你觉得需要补充推导细节或者解析的公式编号,我们看到后会尽快进行补充; 2.评论留下你对南瓜书第4章里相关内容的疑问,我们看到后会尽快进行答疑。

Sm1les avatar Jul 25 '19 02:07 Sm1les

请问,图4.4的决策树,根蒂-色泽那个分支,请问为何色泽浅白判定为好瓜?根蒂(稍蜷)的分支中并没有色泽浅白的样本。

Oscar-YanH avatar Oct 18 '19 01:10 Oscar-YanH

@Oscar-YanH 同学你好,对于这种情况,图4.2下面的段话里面有交代如何处理,如果当前结点包含的样本集合为空,则标记为叶结点,且结点类别设定为其父节点(纹理=清晰,根蒂=稍蜷)所含样本最多的类别。

Sm1les avatar Oct 19 '19 09:10 Sm1les

您好,第四章公式4.10在2016年第一版的机器学习的书上是p_k而不是\rho_k,新版不在手边所以无法对照,如果有误还麻烦你们订正一下

NIL-zhuang avatar Mar 18 '20 01:03 NIL-zhuang

@NIL-zhuang 同学您好,感谢您的反馈,这里确实是我们誊抄的时候出错了,现已订正,感谢您的反馈 :)

Sm1les avatar Mar 18 '20 03:03 Sm1les

请问,连续值处理一节的最后一句,“需注意的是,与离散属性不同,若当前结点划分属性为连续属性,该属性还可作为其后代结点的划分属性,例如在父结点上使用了 "密度<=0.381" ,不会禁止在子结点上使用"密度<=0.294"”,怎么理解?

如果子节点还可以使用密度这个特征,那会不会产生“密度→含糖率→密度→含糖率→……”这种深度大,甚至死循环情况?如果会,一般通过什么手段来避免呢?

感谢~

HJWAJ avatar Mar 01 '22 09:03 HJWAJ

@HJWAJ 你反过来想一下,为啥离散属性做过划分结点后就不能再用了呢?因为按照离散属性划分后,其子节点的样本在该属性上值均相等,因此没法再根据这个属性划分了,例如:按照“根蒂=蜷缩”划分以后,其子节点中的样本的“根蒂”就全都是“蜷缩”了,但是密度不一样,如果你按照"密度<=0.381" 划分,其子节点中的样本的“密度”均小于等于0.381,但是并不相等,因此“密度”这个属性还是可以接着用来区分(或者说划分)子节点中的样本。

Sm1les avatar Mar 01 '22 09:03 Sm1les

请问,第四章课后习题,从哪里找到答案呢? 尤其是编程题,github有这些编程题吗? 谢谢!

momo-9527 avatar Mar 21 '22 09:03 momo-9527