Secbone
Secbone
@peterpanmj there are not many rules for unit testing right now, you can put your unit testing into the `xxx_test.py` file, and write a `def test_xxxx()` function to define a...
@happy5205205 暂时还没有这个功能,需要自己手动写 for 循环,后续版本考虑添加这个功能
@cfkstat 你是指 `inf` 么?inf 本身是有排序性的,不需要单独处理
@cfkstat 缺失值可以通过 `empty_separate` 参数来单独分组,其他值可以在分箱前先过滤该部分数据,分箱后再通过 `update()` 方法手动更改分箱规则
@topxxuki 这种情况不是空值分箱,而是该特征最终只分成了1个箱,即分箱后所有值都是一样的,对于这种特征在最后计算评分的时候是没有用的,所以会在最后去掉这种特征
> 是否会分出空箱需要依据`combiner`的参数以及实际数据分布来确定的。 对于指定4个分箱,实际值只有3个的情况,也需要看具体数据分布和combiner的参数来确定最终结果,不一定会出现空箱
@nllatt `toad.quality` 计算IV等需要分箱的指标时,只会对 数值类型 的变量进行分箱,如果原始变量不是数值类型,则按照类别型变量直接进行计算,而通常类别较多时,IV会越高这是符合逻辑的。我想这应该可以帮你理解1、2问题的现象。 对于 `selection` 中的 数值变量,默认会使用 `dt` 进行 `10` 组的分箱
@cookie918 可以的,标明使用 toad 即可。有功能性的需求也可以提issue,非常欢迎合作

以上已拉群