pumpkin-book
pumpkin-book copied to clipboard
【第4章决策树】待推导或待解析公式征集+答疑专区
在这里,你可以: 1.评论留下西瓜书第4章你觉得需要补充推导细节或者解析的公式编号,我们看到后会尽快进行补充; 2.评论留下你对南瓜书第4章里相关内容的疑问,我们看到后会尽快进行答疑。
请问,图4.4的决策树,根蒂-色泽那个分支,请问为何色泽浅白判定为好瓜?根蒂(稍蜷)的分支中并没有色泽浅白的样本。
@Oscar-YanH 同学你好,对于这种情况,图4.2下面的段话里面有交代如何处理,如果当前结点包含的样本集合为空,则标记为叶结点,且结点类别设定为其父节点(纹理=清晰,根蒂=稍蜷)所含样本最多的类别。
您好,第四章公式4.10在2016年第一版的机器学习的书上是p_k而不是\rho_k,新版不在手边所以无法对照,如果有误还麻烦你们订正一下
@NIL-zhuang 同学您好,感谢您的反馈,这里确实是我们誊抄的时候出错了,现已订正,感谢您的反馈 :)
请问,连续值处理一节的最后一句,“需注意的是,与离散属性不同,若当前结点划分属性为连续属性,该属性还可作为其后代结点的划分属性,例如在父结点上使用了 "密度<=0.381" ,不会禁止在子结点上使用"密度<=0.294"”,怎么理解?
如果子节点还可以使用密度这个特征,那会不会产生“密度→含糖率→密度→含糖率→……”这种深度大,甚至死循环情况?如果会,一般通过什么手段来避免呢?
感谢~
@HJWAJ 你反过来想一下,为啥离散属性做过划分结点后就不能再用了呢?因为按照离散属性划分后,其子节点的样本在该属性上值均相等,因此没法再根据这个属性划分了,例如:按照“根蒂=蜷缩”划分以后,其子节点中的样本的“根蒂”就全都是“蜷缩”了,但是密度不一样,如果你按照"密度<=0.381" 划分,其子节点中的样本的“密度”均小于等于0.381,但是并不相等,因此“密度”这个属性还是可以接着用来区分(或者说划分)子节点中的样本。
请问,第四章课后习题,从哪里找到答案呢? 尤其是编程题,github有这些编程题吗? 谢谢!