tgboost icon indicating copy to clipboard operation
tgboost copied to clipboard

Tiny Gradient Boosting Tree

Results 5 tgboost issues
Sort by recently updated
recently updated
newest added

The original code is: ```java private void initialize_cutting_inds_thresholds(){ cutting_inds = new int[feature_dim][][]; cutting_thresholds = new float[feature_dim][]; for(int i=0;i

现在的代码逻辑,离散特征也会被装箱(bin) 然后就是按照连续特征来处理了。这样的处理,默认离散特征就是有序的了,所以m个特征值有m-1个箱子。但是如果离散特征是无序的,那么箱子数量应该是指数级的。这个地方是不是可以在优化下那?还是说xgboost就是按照无序来处理的? 参考Spark中决策树对于离散特征的处理会先判断离散特征是有序还是无序的,然后在进行装箱。 才疏学浅,很想把大佬的代码吃透了。。。

代码里this_threshold = (cur_value + nxt_value) / 2.0 如果当前列是离散值 tgboost是不是还不支持? 另外Y.hess.sum() < self.min_child_weight为何用二阶导数的sum作为判定标准没有想明白。谢谢你。

Why pass reg_lambda into the loss class? I don't see any usage of reg_lambda in the loss class.

其实一个应该是 child 最小 sample 数吧