data-group
data-group copied to clipboard
可能利用matplotlib画一些数据可视化的图, 通过data.describe()查看数据的一些指标,包括最大最小值,平均值,方差,判断数据是否需要标准化, 通过箱线图查看数据的一些分布,查看一些异常值, 还有加上前面一个问题,在什么样的条件下,判断需要加上一些特征的组合,再去尝试模型的效果是否有提升。
我看到一个大神的博客写的这句话,但是不是很理解。 特征组合之后,为什么会更容易线性可分 应该怎么理解呢
在推荐或广告的业务中,我们经常采取以下方式选出最终的item: 1. 召回:根据一定的规则,如query/user和item的相关性,得到一个item的候选集; 2. 打分&排序:对item进行打分并排序; 3. 策略:人为制定一些策略,对item进行过滤或调整排序队列,并将最终排序队列的TopN作为推荐结果。 问题:假设我们上了一个新策略,或对item的打分公式做了调整,如果衡量新的策略和已有的策略是否存在冲突或可能互相之间有影响?
一个宽表解决需求,还是维度和订单表分开。这个你们是不是也有时候拆,有时候合。然后,自己也搞不清楚啥时候拆,啥时候合。都是被牵着鼻子走。
自荐一下自己的个人主页。格式:网站名-主题-链接 比如:木东居士-数据仓库和数据挖掘-http://www.mdjs.info/