yangyang
yangyang
> gene_action产生的是id,怎么可以reshape成[a_dim,]传入critic网络的不应该是action对应的权重吗 请问这个项目你现在可以run起来了吗,我也遇到了一些问题
你也在学习强化学习的类容吗 davidjiangt 于2019年10月22日周二 下午9:02写道: > 没有,这个应该不是源码 > > — > You are receiving this because you commented. > Reply to this email directly, view it on GitHub > , >...
我做的有点偏资源分配,可能也差不多吧😂 davidjiangt 于2019年10月23日周三 下午8:47写道: > 强化学习基于推荐系统,如果一样可以交流 > > — > You are receiving this because you commented. > Reply to this email directly, view it on GitHub > , >...