AlphaZero_Gomoku icon indicating copy to clipboard operation
AlphaZero_Gomoku copied to clipboard

请问人机对弈的时候,为什么不保留之前的树的统计数据呢?

Open gmftbyGMFTBY opened this issue 6 years ago • 5 comments

https://github.com/junxiaosong/AlphaZero_Gomoku/blob/66292c55cc53acfae7f7bc5a15a370571549bdd9/mcts_alphaZero.py#L206

gmftbyGMFTBY avatar Jul 02 '18 03:07 gmftbyGMFTBY

我的意思是,如果保留了是不是效果会更好呢?

gmftbyGMFTBY avatar Jul 02 '18 03:07 gmftbyGMFTBY

人机对弈的时候还要考虑人一方的move,另外即使保留也只是两个move之后的子树,考虑到每一层的分支数量,两层之后的一个分支中的数据其实很少

junxiaosong avatar Jul 10 '18 10:07 junxiaosong

谢谢

gmftbyGMFTBY avatar Jul 11 '18 01:07 gmftbyGMFTBY

人机对弈的时候还要考虑人一方的move,另外即使保留也只是两个move之后的子树,考虑到每一层的分支数量,两层之后的一个分支中的数据其实很少

那在self_play的过程中为什么就要保存下来呢? 是因为self_play的过程中页是经过类似的搜索过程对整颗mcts树上的值有变动吗?

mrmitzh avatar Mar 17 '19 12:03 mrmitzh

人机对弈的时候还要考虑人一方的move,另外即使保留也只是两个move之后的子树,考虑到每一层的分支数量,两层之后的一个分支中的数据其实很少

那在self_play的过程中为什么就要保存下来呢? 是因为self_play的过程中页是经过类似的搜索过程对整颗mcts树上的值有变动吗?

个人理解如果人机的话,只有一方搜索,相当于树更多的包含了对机器有利的分支,因为人很可能走对他有利的分支,这个分支很可能在树里面比较少探索的深度比较有限,所以保留下来意义也不大,数据太少。而如果self play 的时候,两个方向都有一定深度,所以适合共享

zyfo2 avatar Jul 29 '20 10:07 zyfo2