AlphaZero_Gomoku-tensorflow issues

trian.py不保存模型的问题

2

run中： ` for i in range(5): verbose = i % 5 == 0` 改为： ` for j in range(5): verbose = j % 5 == 0`

尽管不涉及错误，也不影响什么，双重循环看起来还是很不舒服，毕竟0（1）的问题变成了0(n^2）的问题了，做如下修改比较好： def click1(self, event): #click1 because keyword repetition size = self.board.width current_player = self.board.get_current_player() if current_player == 1: # for i in range(size): # for j in range(size): i=(event.x)//30...

fmscole

训练时长？

请问你训练了多久，电脑配置以及总共对弈了大概多少局？

initial-h

关于模型的问题

请问 [自己训练生成的模型](https://github.com/zouyih/AlphaZero_Gomoku-tensorflow/tree/master/model) 应该怎么使用呢，或者是怎么转换呢？

frendguo

loss计算的问题

2

在 tf_policy_value_net.py 第54行，定义了每个动作的概率是 self.action_probs = tf.nn.softmax(policy_net_out, name="policy_net_proba")，第90行定义的loss是 cross_entropy = tf.nn.softmax_cross_entropy_with_logits(logits=self.action_probs, labels=self.mcts_probs)。但tensorflow[文档](https://www.tensorflow.org/api_docs/python/tf/nn/softmax_cross_entropy_with_logits)对 tf.nn.softmax_cross_entropy 这个函数有个warning ，是说不要把softmax的输出给这个函数，因为这个函数内部会自己对logits做一遍softmax……所以这里直接用这个loss是不是不太好另外，请问model文件夹里的模型是从0开始用这份代码训练的，还是已经训练好的theano/pytorch的模型直接转成tensorflow模型得到的？

entalent

能否更新到python3.12和tensorflow2.18.0呢

hzr12

AlphaZero_Gomoku-tensorflow
AlphaZero_Gomoku-tensorflow copied to clipboard

Metadata

trian.py不保存模型的问题

click部分代码简化问题

训练时长？

关于模型的问题

loss计算的问题

能否更新到python3.12和tensorflow2.18.0呢

← Metadata

Owner

Metadata

AlphaZero_Gomoku-tensorflow AlphaZero_Gomoku-tensorflow copied to clipboard

Metadata

trian.py不保存模型的问题

click部分代码简化问题

训练时长？

关于模型的问题

loss计算的问题

能否更新到python3.12和tensorflow2.18.0呢

← Metadata

Owner

Metadata

AlphaZero_Gomoku-tensorflow
AlphaZero_Gomoku-tensorflow copied to clipboard