jxt1234
jxt1234
1. 这个原因是 3.1 对 vulkan 后端做了优化,引入 autotuning 以提升性能,对应地增加了初始化时间,可以预先生成 cache file 来降低后续的初始化时间。此外,如果导致了 crash 可以附上模型我们看一下。 2. 3.0.0 相比 2.6.0 vulkan 应该是修了一些 bug ,没做性能优化。 3. 如果有发热等问题,建议都改成 numThread = 1 ,CPU 也不用多线程
> > 1. 这个原因是 3.1 对 vulkan 后端做了优化,引入 autotuning 以提升性能,对应地增加了初始化时间,可以预先生成 cache file 来降低后续的初始化时间。此外,如果导致了 crash 可以附上模型我们看一下。 > > 2. 3.0.0 相比 2.6.0 vulkan 应该是修了一些 bug ,没做性能优化。 > > 3. 如果有发热等问题,建议都改成 numThread...
> ## 这里还有一个 share库兼容的问题 更换了 咱们的库以后 我这边初始化其他 SDK报错 > 2025-05-16 22:11:11.001 17553-17641 System.err com.situvision.ergolife W android.content.res.Resources$NotFoundException: String resource ID #0x0 2025-05-16 22:11:19.117 17127-17127 QarthLog com.situvision.ergolife I [PatchStore] createDisableExceptionQarthFile 2025-05-16 22:11:19.120...
那只能用你们的 ndk 工具重编代码了。
llmexport 加上 `--awq --lm_qunat_bit=8` 试下,提升一下精度
You can use MNN::cv::warpAffine to do resize and pad.
mips 上只能增加 -DMNN_USE_SSE=OFF ,编译纯 C++ 版本
1. what's the version of MNN ? 2. It seems that MNN's CPU is right but CUDA is wrong? 3. For TopK, if input's value is very closely. Inference engine...
ok. We will check it.
近期会开放 sherpa-mnn