rlcard
rlcard copied to clipboard
Random agent 能用 nfsp agent 替换掉吗
看nfsp里,第2个player是random agent, 产生random动作,能像第一个agent一样也用nfsp agent吗,是因为random探索更好更全吗,看训练时只用nfsp agent产生的数据,如果两个player同样用一种 agent, 是不是数据搜集速度翻倍啊。想用在近似无限回合的game, 如果用random探索会不会太慢啊。
非常感谢,
ant
@ant3001 这个是可以的 example里面只是示例。https://github.com/datamllab/rlcard/blob/master/examples/run_dmc.py 这个例子就是所有玩家都用RL
@daochenzha 多谢,多谢,越看觉得很多才看明白,每个play可以不同的agent,这种架构很强啊。