BELLE
BELLE copied to clipboard
请问为什么微调后的权重大小翻倍
我查看了bloom-7B是基于FP16的参数,模型大小十几个G。 为什么belle-7B模型大小来到了二十多个G,是从FP16转移到了FP32吗?
同问,不知道原因
同问
我查看了bloom-7B是基于FP16的参数,模型大小十几个G。 为什么belle-7B模型大小来到了二十多个G,是从FP16转移到了FP32吗?
同问,不知道原因
同问