topxxuki
topxxuki
> @topxxuki 这种情况不是空值分箱,而是该特征最终只分成了1个箱,即分箱后所有值都是一样的,对于这种特征在最后计算评分的时候是没有用的,所以会在最后去掉这种特征 当前这个情况,我使用combiner时指定了4个分箱,抽样之后,由于jj_if_continue_desc特征值都一样,所以分箱结果只有一箱。 如果指定4个分箱,但某一特征列中只有3个唯一值,这样才会出来空箱是么?
1. c.fit(train_selected.drop(to_drop, axis=1), y = 'label', method = 'quantile',n_bins=10) 在一个模型里 是否支持不同的列使用不同的bin个数? 2.fit之前/之后,在已有的分箱规则基础上,是否支持添加一些自定义的分箱规则?
> @topxxuki > > 1. 暂时不支持配置不同的bin个数,你可以分批fit,添加参数`c.fit(....., update = True)` 可以做增量更新;或者使用不指定 `n_bins` 的方式,如 `min_sample` 之类的自适应分箱 > 2. fit 之后可以使用 `c.update()` 来更新分箱规则,具体可以查看一下文档 感谢分享,另外还想问些问题: 1. data:image/s3,"s3://crabby-images/24662/246621ae5bd56c5af7f1f9e49a4521cfed73969d" alt="image" 观察到分箱的区间均为左闭右开,是否支持左开右闭的分箱方法呢? 2. 分箱方法目前有'dt', 'chi', 'quantile', 'step', 'kmeans'...
> See if you can follow https://github.com/combust/mleap/tree/master/mleap-spring-boot and use the most recently released version 0.15.0, the easiest would be to do this, as mentioned in that README.md file > >...