Interview
Interview copied to clipboard

Published 20 hours ago •

Reame
Issues

【收集】比赛项目+特征工程

Open jiangzhonglian opened this issue 5 years ago • 1 comments

多标签（multi_label）分类

时间序列问题（单变量+多变量）

如何开发 LSTM 模型进行时间序列预测

【收集】实时流

flume+kafka+spark streaming+hdfs 整合项目

【收集】数据采集

数据增强：以防止过拟合，并提高模型的泛化能力
- https://zhuanlan.zhihu.com/p/63182132
- https://zhuanlan.zhihu.com/p/102640267

【收集】特征工程

数据处理

在每个样本上减去数据的统计平均值可以移除共同的部分，凸显个体差异。

使用sklearn做单机特征工程

https://www.cnblogs.com/jasonfreak/p/5448385.html

特征工程系列

特征工程系列：特征筛选的原理与实现（上）
https://www.cnblogs.com/purple5252/p/11205500.html
特征工程系列：特征筛选的原理与实现（下）
https://www.cnblogs.com/purple5252/p/11211083.html

混淆矩阵及confusion_matrix函数的使用

https://blog.csdn.net/u011734144/article/details/80277225

sklearn 网格搜索 - 得到最优参数

https://github.com/apachecn/ml-mastery-zh/blob/master/docs/xgboost/tune-number-size-decision-trees-xgboost-python.md

Aug 15 '20 08:08 jiangzhonglian

Jun 02 '21 03:06 jiangzhonglian