苏剑林(Jianlin Su) comments

Results 390 comments of


                                            苏剑林(Jianlin Su)

剑林大神，请问kg-2019你训练的模型能不能分享下？我自己训练的模型达不到你说的分数。感谢

> 代码中的 word2vec = Word2Vec.load('../word2vec_baike/word2vec_baike') > 加载的是作者自己训练的词向量，这个训练后的词向量能不能直接分享给我们？^_^ 那这里的是什么？https://github.com/bojone/kg-2019/issues/9#issuecomment-592313140

load_weights和save_weights是keras的方法，save_weights_as_checkpoint和load_weights_from_checkpoint是bert4keras的方法，Model没有save_weights_as_checkpoint是显然成立的事情。只要稍加理解keras和bert4keras的关系，查看一下build_transformer_model的源码，就能写出了： ```python bert = build_transformer_model(xxx, return_keras_model=False) model = bert.model model.load_weights(xxxxxx) bert.save_weights_as_checkpoint(xxxxx) ```

请问这怎么使用？

https://github.com/bojone/nezha_gpt_dialog/blob/master/test.py

为什么要跑一百个epoch？

特意翻了一下，10个epoch是loss=0.9743,val_score=0.93242，20个epoch是loss=0.7957,val_score=0.94880，50个epoch是loss=0.5740,val_score=0.95414。没有看出“十几个epoch时候loss已经不去下降了”这个结论。而且100个epoch只是稳妥做法，你跑50个问题也不会太大。