780966854

Results 1 comments of 780966854

> 请问最后实现了吗,默认只在第一块gpu进行加载和运算 不行,单卡多模型可以运行,但是一个模型推理的时候现存利用率会拉满,另一个模型只能等第一个推理完后才能推理,然后2个结果一起返回