RandomForest icon indicating copy to clipboard operation
RandomForest copied to clipboard

随机森林,Random Forest(RF)

Results 12 RandomForest issues
Sort by recently updated
recently updated
newest added

![image](https://user-images.githubusercontent.com/102207243/163169247-5f164dd9-ec53-4810-882b-4a058ddea608.png) 您好老师,请问一下,这样在分裂的时候,当子节点样本数小于等于min_sample_leaf时,父节点停止分裂,这样感觉min_sample_leaf的设置有点奇怪,比如min_sample_leaf=1,就是他可能会在子节点中划分到1和xx,就删除了子节点,只划分到父节点了,这样会导致子节点中的最小样本数为2,我在pima数据集上做,和sklearn上实现的决策树相比,他的节点数少了一半以上,那这样的设置,是不是在上图应该把小于等于改成小于。 有点疑问 期待您的回复

我使用其他的数据集,无论是使用全部特征还是sqrt求出的特征,又或者是使用全部特征的单个决策树,预测结果都很差,尤其是训练集作为测试集,预测只有60%多。 参数: clf = RandomForestClassifier(n_estimators=1, max_depth=-1, min_samples_split=2, min_samples_leaf=1, min_split_gain=0.0, colsample_bytree=70, subsample=1.0, random_state=66) train_count = int(0.7 * len(df)) 下面是预测的结果。 0.6125 0.2375

如果可以处理离散变量就更好了

老师您好, 假如我应用此模型来预测医院药品的销量,您觉得可以实现吗? 需要考虑的特征都有哪些呢? 谢谢您。

老师好,我做的随机森林回归得到的评分score为负数,不知道如何解读。您知道吗?谢谢!

您好,这个程序改的我已经完全看不懂了。。。能留个联系方式方便咨询您吗?

您好,能解释一下housing.txt里CRIM,ZN,INDUS,CHAS,NOX,RM,AGE,DIS,RAD,TAX,PTRATIO,B,LSTAT,MEDV 这个标头都是什么意思嘛? 万分感谢!

为什么运行这么慢,有没有什么可以加速的技巧和方法

features = random.sample(dataSet.columns.values[:-1], int(math.sqrt(m - 1))) TypeError: Population must be a sequence or set. For dicts, use list(d). What should I do? Thank you.