LLM-TPU
LLM-TPU copied to clipboard
在跑github下载已经转好的qwen-vl-chat-combine.bmodel模型时,会提示内存不足
用bmrt_test --bmodel 测试模型时发现的这个问题