data-group
data-group copied to clipboard
逻辑回归的连续型变量分箱处理问题
原提问
逻辑回归的连续型变量分箱处理,这一块除了基于业务经验,一般还有什么办法?大家平常做分箱处理在业务理解后,分箱用等频/等值的选择,以及分箱之后的Bing处理会怎么操作?
对于连续型变量分箱,如果是金融方面,建议用Weight Of Evidence
如果是离线的话,可以用单变量阈值选择,相当于单变量进行聚类,或者用Conditional Inference Tree递归也可以。 单变量递归主要解决连续变量离散化的问题