aobazero icon indicating copy to clipboard operation
aobazero copied to clipboard

AobaZeroのweightの更新を10000棋譜から34285棋譜ごとに

Open yssaya opened this issue 4 years ago • 0 comments

重みの更新を10000棋譜から34285棋譜に変更しました。 これはAlphaZeroが2400万棋譜、70万回学習、mini-batch=4096、1000回学習ごとに重み更新、なので 3.4285万棋譜(=2400/(700000/1000))に合わせたためです。

今までは1万棋譜ごとで直近の50万棋譜からサンプリング、なので50世代、 3.4285万棋譜だと15世代が含まれます。

mini-batch=128 だと32000回学習((4096/128)*1000)ごとに重み更新、なので 3.4285万棋譜で32000回学習になるように 1棋譜あたり1.07142回学習されるように 棋譜追加時の学習回数も調整しています。 今までは1棋譜あたり1回の学習でした。 1回で128局面を学習するので現在の平均手数85手だと1局面あたり1.41回ほど学習することになります。

yssaya avatar Dec 28 '20 18:12 yssaya