rlcard icon indicating copy to clipboard operation
rlcard copied to clipboard

Random agent 能用 nfsp agent 替换掉吗

Open ant3001 opened this issue 3 years ago • 2 comments

看nfsp里,第2个player是random agent, 产生random动作,能像第一个agent一样也用nfsp agent吗,是因为random探索更好更全吗,看训练时只用nfsp agent产生的数据,如果两个player同样用一种 agent, 是不是数据搜集速度翻倍啊。想用在近似无限回合的game, 如果用random探索会不会太慢啊。

非常感谢,

ant

ant3001 avatar Oct 10 '22 16:10 ant3001

@ant3001 这个是可以的 example里面只是示例。https://github.com/datamllab/rlcard/blob/master/examples/run_dmc.py 这个例子就是所有玩家都用RL

daochenzha avatar Oct 12 '22 02:10 daochenzha

@daochenzha 多谢,多谢,越看觉得很多才看明白,每个play可以不同的agent,这种架构很强啊。

ant3001 avatar Oct 13 '22 04:10 ant3001