Firefly
Firefly copied to clipboard
“max_seq_length:训练时的最大长度。按照自己的设备进行设置,越长需要占用越多显存。”这个有换算规则吗?