toad
toad copied to clipboard
评分卡训练过程中会丢弃空分箱吗?
如上图所示,分箱模型中包含cust_xintuo_bal_mon_end, 但评分卡的训练结果报告中不包含改列。
发现其他例如
jj_if_continue_desc
dq_ration_if_cntn_asc
tran_ration_if_cntn_desc
tran_ration_if_cntn_asc
分箱只有一个空箱的情况时,都不包含在评分卡的训练结果里。
@topxxuki 这种情况不是空值分箱,而是该特征最终只分成了1个箱,即分箱后所有值都是一样的,对于这种特征在最后计算评分的时候是没有用的,所以会在最后去掉这种特征
@topxxuki 这种情况不是空值分箱,而是该特征最终只分成了1个箱,即分箱后所有值都是一样的,对于这种特征在最后计算评分的时候是没有用的,所以会在最后去掉这种特征
当前这个情况,我使用combiner时指定了4个分箱,抽样之后,由于jj_if_continue_desc特征值都一样,所以分箱结果只有一箱。 如果指定4个分箱,但某一特征列中只有3个唯一值,这样才会出来空箱是么?
是否会分出空箱需要依据combiner
的参数以及实际数据分布来确定的。
对于指定4个分箱,实际值只有3个的情况,也需要看具体数据分布和combiner的参数来确定最终结果,不一定会出现空箱