AlphaZero_Gomoku 训练超级慢，有什么办法可以提高效率？

训练超级慢，有什么办法可以提高效率？

Open xbhuang1994 opened this issue 7 years ago • 6 comments

大量的计算力花费在了mcts的select与expand上，policy只占了1/8不到的时间，即使用TPU来跑CPU也跟不上，如何让mcts并发运行变得更加高效？

Jul 13 '18 22:07 xbhuang1994

MCTS模拟确实是占了绝大部分计算量的，所以deepmind采用了5000个TPU，要直接让它计算高效起来估计有点难，但MCTS是可以并行执行的，AlphaGo zero论文里使用了一个叫做virtual loss的trick来并行的跑mcts，大致来说就是当一个线程正在一个树分支上搜索时，临时改变一下这个分支上的节点的统计数据，比如把访问次数加的很大，使得其他并行搜索的线程会去搜索另外的分支。