pytorch-A3C
pytorch-A3C copied to clipboard
没看懂为什么push里面要把ba的类型转成np.int64
v_wrap(np.array(ba), dtype=np.int64) if ba[0].dtype == np.int64 else v_wrap(np.vstack(ba)),
一般连续动作不应该用float64吗 而且判断条件是dtype==np.int64时转为np.int64,是不是写错了?
buffer_r.append((r+8.1)/8.1) # normalize 为什么r需要标准化? 8.1是怎么来的?