InternEvo
InternEvo copied to clipboard
[Bug] 仅支持了GShard模式的MoE模型转huggingface
Describe the bug
- 之前给出的脚本仅支持了GShard MoE训练的方式转化hf的脚本,但是如果用MegaBlock进行训练的话权重转换脚本就不适用了。
- 仍然未提供已经训练好的Internevo的权重转换成internevo MoE权重的脚本。
Environment
官方镜像
Other information
No response