RoFormer_pytorch 您好！有一个关于模型转换的问题

您好！有一个关于模型转换的问题

Open EddieChen324 opened this issue 2 years ago • 3 comments

我发现在bert4keras读取苏老师开源的chinese_roformer-sim-char-ft_L-12_H-768_A-12和在transformers上读取您的junnyu/roformer_chinese_sim_char_ft_base提取的句向量的效果是差不多的，但是当我尝试将苏老师的模型转为pytorch_bin再用transformers读取后，pooler层怎么都加不上去（bert4keras里指定with_pool='linear'就可以）请问您是如何解决的？

May 19 '22 03:05 EddieChen324

还有一个问题是在transformers上读取苏老师的模型，它的权重几乎都被重新初始化了导致每次的句向量结果都不一样。。。不知道您是怎么转换的所以transformers可以正常读取？

May 19 '22 03:05 EddieChen324

请使用本仓库的转换代码https://github.com/JunnYu/RoFormer_pytorch/blob/roformer_v2/src/roformer/convert_roformer_original_tf_checkpoint_to_pytorch.py 这个代码对roformer sim用了CasualLM模型加载转换，如果需要pooler的权重请确保RoFormerModel里面的add pooler layer＝True。详细的你可以参考一下，readme里面一个Roformer-sim测试例子。然后有关config，参考https://huggingface.co/junnyu/roformer_chinese_sim_char_ft_small/blob/main/config.json 这里面。

May 19 '22 06:05 JunnYu

请使用本仓库的转换代码以及roformer模型，如果需要pooler的权重请确保BertModel里面的add pooler layer＝True。详细的你可以参考一下，readme里面一个Roformer-sim测试例子。然后有关config，参考https://huggingface.co/junnyu/roformer_chinese_sim_char_ft_small/blob/main/config.json 这里面。

您好在用了您仓库的转换代码后已经可以正常读取了谢谢您！

May 19 '22 06:05 EddieChen324

RoFormer_pytorch RoFormer_pytorch copied to clipboard

您好！有一个关于模型转换的问题

RoFormer_pytorch
RoFormer_pytorch copied to clipboard