jxt1234 comments

Results 338 comments of


                                            jxt1234

1. 确认下是否跑到 gpu 上了（是否 linux 的 vulkan 驱动是软件模拟的） 2. 看下是否有多张显卡，跑到较弱的显卡上了

修改 source/backend/opencl/CMakeLists.txt ，把 add_definitions(-DMNN_SUPPORT_INTEL_SUBGROUP) 去掉试试

原始模型是什么，怎么进行qat的?

我们看一下

thread_num 需要设成 68 (buffer 模式)，用 image 模式有可能对于大尺寸情况下无法支持。

不影响。68 表示 autotuning + buffer 模式，不是线程数的含义： https://mnn-docs.readthedocs.io/en/latest/inference/session.html

设成 4 的话，估计有较多算子回退到 CPU 了

mnn 是什么时候的代码？看着应该是内存不足了。模型是多大？int4 量化过的么？编译 mnn 时是否打开了 -DMNN_LOW_MEMORY=ON ?

模型上传来看一下?

最新代码有问题么?