scutquant
scutquant copied to clipboard
scutquant是一个开源的离线量化投资平台,由华南理工大学量化投资协会负责维护. 该框架具有低耦合, 高内聚的特点
宁哥,那个scutquant.py的自动处理器def auto_process函数传入的split_params里面有个参数名“test_date”,应该要改成“test_start_date”吧?因为下面调用的split_data_by_date函数识别的那个测试集开始日期参数名是“test_start_date”
我们使用平安银行的3秒钟股票数据,拟合了它的收益率,进而计算出它的股价 为了避免[数据泄露](https://www.kaggle.com/code/alexisbcook/data-leakage),我们构建的特征将全部使用历史数据(即滞后项)和时序特征(只与当前的时间有关) 为了构建时序特征,我们将从趋势(trend)、季节(seasonality)和周期三个角度对目标值ret进行分析(即Auto_ts_ana) 随后,我们清除缺失值,并分别对目标值和特征,训练集和测试集进行标准化(在机器学习领域,数据最好都呈正态分布,因此需要标准化),同样地,为了避免数据泄露,我们使用训练集的数据特征对所有数据进行标准化 最后我们[拟合模型](https://www.kaggle.com/code/ryanholbrook/hybrid-models),我们还可以更进一步查看模型的[shapley value](https://www.kaggle.com/code/dansbecker/advanced-uses-of-shap-values),从而保证模型的可解释性 ######################################################################################### **拓展阅读资料:** [评估数据集质量(特征选择)](https://www.kaggle.com/code/ryanholbrook/mutual-information) [标准化](https://www.kaggle.com/code/alexisbcook/scaling-and-normalization),[石川,刘洋溢,连祥斌 因子投资方法与实践](https://github.com/HaoningChen/ScutQuant/tree/main/%E6%96%87%E4%BB%B6)p301~302(在scutquant中我们采用的是5倍标准差) [时间序列季节性](https://www.kaggle.com/code/ryanholbrook/seasonality) [时间序列周期性(滞后项)](https://www.kaggle.com/code/ryanholbrook/time-series-as-features) ######################################################################################### 录屏:链接:https://share.weiyun.com/fdgBJTE1 密码:btg9ux ######################################################################################### 大家有问题也可以在Issue区留言