Jun2Hou
懂了,就是寻找同标签的相同特征和不同标签的区别特征。 这种交互是暴力试出来的好,还是通过数据EDA/分析业务逻辑得到?
可是出账金额相同的,他们的size统计特征也相同,这不是重复特征了? 树的列抽样会更容易把相同套餐的id,预测为一类? 还是这个total_fee的size统计特征有其他的考量? 谢谢
soga