caofx0418
Results
2
comments of
caofx0418
高手,在高通8gen3上,llama2-7B推理性能如何? 多少token/s ?
Llama 7b 有20token 太棒了! 使用llama.cpp在8gen3的cpu上4线程推理llama2-7B最多只有5token