StockRL
StockRL copied to clipboard
更新action的处理时机
具体更新思路参见 #9
嗯嗯,我周末有空的时候 Review 一下
感觉作者的逻辑应该没有问题吧,给当天的state,然后在收盘的时候进行交易,可以这么理解,相当于intraday,为什么非要根据今天的高低开收去预测明天的收盘进行交易呢,在实际中你也不会这么交易吧。
感觉作者的逻辑应该没有问题吧,给当天的state,然后在收盘的时候进行交易,可以这么理解,相当于intraday,为什么非要根据今天的高低开收去预测明天的收盘进行交易呢,在实际中你也不会这么交易吧。
不, 问题很大, 你不可能在知道今天收盘价的同时以收盘价进行交易, 就算在知道收盘价的一瞬间进行交易也会被拉到明天开盘去进行集合竞价并以开盘价进行交易. 实际部署的情况下最多只能用最后几分钟的数据"视为"收盘价, 但是就会导致实际环境的交易量也好, 收盘价也好, 当日的等等一系列数据都不是真正的收盘价. 也就是说作者给出的训练环境只能是对现实情况的近似理想环境
我理解一下:该 commit 的改动思路是,使用明天的收盘价进行今天的交易? 这样有点不太合理吧,使用今天的收盘价是有点理想化,但是这是量化中比较常用的方式 有问题可以继续讨论,我先关闭这个 PR