DuBaiSheng
DuBaiSheng
你好,我想请教下,无监督使用的验证集sts-dev,里面有相关系数。本质上还是个有标签的数据,或者说是需要标注的数据。那如果在没有标注的数据的情况下,这个eval()验证 如果去做呢。
训练好的中文模型预测
训练好的中文模型预测是不是有问题,给的样例预测结果都是错的。
请问一下。分别使用了 qwen2-7B-instruct-AWQ 和qwen2-7B-instruct-GPTQ-int4 两个量化模型进行lora微调,loss 都不收敛。learning-rate 几步之后,就不变了。尝试修改learning-rate、lora-rank 都没有用。 同样的数据,采用qwen2-7B-instruct lora微调能正常收敛。
使用export 导出的onnx格式的模型,并使用SenseVoiceSmall加载,批次推理的时长,比原本使用AutoModel加载的原始模型 要慢7倍。是什么原因呢,都是使用GPU加载推理。