EddieChen324 comments

Results 3 comments of


                                            EddieChen324

您好！有一个关于模型转换的问题

还有一个问题是在transformers上读取苏老师的模型，它的权重几乎都被重新初始化了导致每次的句向量结果都不一样。。。不知道您是怎么转换的所以transformers可以正常读取？

> 请使用本仓库的转换代码以及roformer模型，如果需要pooler的权重请确保BertModel里面的add pooler layer＝True。详细的你可以参考一下，readme里面一个Roformer-sim测试例子。然后有关config，参考https://huggingface.co/junnyu/roformer_chinese_sim_char_ft_small/blob/main/config.json 这里面。您好在用了您仓库的转换代码后已经可以正常读取了谢谢您！

您好请问在simbert模型里面 seq2seq的loss比similarity的loss大的多是正常的吗？

> 两者能正常下降，大概率应该就是没问题您好我把您关于similarity loss获得labels函数的最后一段的argmax给注释掉了因为我看苏神的bert4keras这一块好像直接就把labels矩阵传过去了请问您为什么要在那一块加argmax呀

EddieChen324

您好！有一个关于模型转换的问题

您好！有一个关于模型转换的问题

您好 请问在simbert模型里面 seq2seq的loss比similarity的loss大的多是正常的吗？

您好请问在simbert模型里面 seq2seq的loss比similarity的loss大的多是正常的吗？