Interview
Interview copied to clipboard
【收集】比赛项目+特征工程
- 多标签(multi_label)分类
- 时间序列问题(单变量+多变量)
【收集】实时流
【收集】数据采集
- 数据增强: 以防止过拟合,并提高模型的泛化能力
【收集】特征工程
数据处理
在每个样本上减去数据的统计平均值可以移除共同的部分,凸显个体差异。
使用sklearn做单机特征工程
- https://www.cnblogs.com/jasonfreak/p/5448385.html
特征工程系列
- 特征工程系列:特征筛选的原理与实现(上)
- https://www.cnblogs.com/purple5252/p/11205500.html
- 特征工程系列:特征筛选的原理与实现(下)
- https://www.cnblogs.com/purple5252/p/11211083.html
混淆矩阵及confusion_matrix函数的使用
- https://blog.csdn.net/u011734144/article/details/80277225
sklearn 网格搜索 - 得到最优参数
- https://github.com/apachecn/ml-mastery-zh/blob/master/docs/xgboost/tune-number-size-decision-trees-xgboost-python.md
