RandomForest issues

模型的min_sample_leaf问题

2

![image](https://user-images.githubusercontent.com/102207243/163169247-5f164dd9-ec53-4810-882b-4a058ddea608.png) 您好老师，请问一下，这样在分裂的时候，当子节点样本数小于等于min_sample_leaf时，父节点停止分裂，这样感觉min_sample_leaf的设置有点奇怪，比如min_sample_leaf=1，就是他可能会在子节点中划分到1和xx，就删除了子节点，只划分到父节点了，这样会导致子节点中的最小样本数为2，我在pima数据集上做，和sklearn上实现的决策树相比，他的节点数少了一半以上，那这样的设置，是不是在上图应该把小于等于改成小于。有点疑问期待您的回复

shdiuhiuhkj

模型预测结果不正确

8

我使用其他的数据集，无论是使用全部特征还是sqrt求出的特征，又或者是使用全部特征的单个决策树，预测结果都很差，尤其是训练集作为测试集，预测只有60%多。参数： clf = RandomForestClassifier(n_estimators=1, max_depth=-1, min_samples_split=2, min_samples_leaf=1, min_split_gain=0.0, colsample_bytree=70, subsample=1.0, random_state=66) train_count = int(0.7 * len(df)) 下面是预测的结果。 0.6125 0.2375

zgkom

离散变量

如果可以处理离散变量就更好了

metaphysicser

模型的实现问题

老师您好，假如我应用此模型来预测医院药品的销量，您觉得可以实现吗？需要考虑的特征都有哪些呢？谢谢您。

aanoway

question

4

老师好，我做的随机森林回归得到的评分score为负数，不知道如何解读。您知道吗？谢谢！

markgl2019

程序里的问题

1

您好，这个程序改的我已经完全看不懂了。。。能留个联系方式方便咨询您吗？

zyl2014888

Question

8

您好，能解释一下housing.txt里CRIM,ZN,INDUS,CHAS,NOX,RM,AGE,DIS,RAD,TAX,PTRATIO,B,LSTAT,MEDV 这个标头都是什么意思嘛？万分感谢！

zyl2014888

为什么运行这么慢。。

1

为什么运行这么慢，有没有什么可以加速的技巧和方法

xixi911

running error

1

features = random.sample(dataSet.columns.values[:-1], int(math.sqrt(m - 1))) TypeError: Population must be a sequence or set. For dicts, use list(d). What should I do? Thank you.

Yan-echo

请问这个decision tree的算法是CART 还是 C4.5

谢谢

YunruiZhang

RandomForest
RandomForest copied to clipboard

Metadata

模型的min_sample_leaf问题

模型预测结果不正确

离散变量

模型的实现问题

question

程序里的问题

Question

为什么运行这么慢。。

running error

请问这个decision tree的算法是CART 还是 C4.5

← Metadata

Owner

Metadata

RandomForest RandomForest copied to clipboard

Metadata

← Metadata

Owner

Metadata

RandomForest
RandomForest copied to clipboard