MiniCPM-o
MiniCPM-o copied to clipboard
int4和bffloat16推理时间问题(着急)
用如下代码分别测试MiniCPM-2B-dpo-bf16和MiniCPM-dpo-Int4两个模型,推理时间MiniCPM-2B-dpo-bf16有3秒多,MiniCPM-dpo-Int4有10秒以上,请问原因是啥?