Tenghao
Tenghao
> 可能是gpu模型加载比较慢 不太可能吧,模型的初始化和推理是分开的,测试是仅仅针对于推理 `auto outputTensor = session.Run(Ort::RunOptions{nullptr}, NetInputNames.data(), &inputTensor, NetInputNames.size(), NetOutputNames.data(), NetOutputNames.size());` ,也就是只对比这一行的耗时。 考虑到可能是不是输入的影响,我对多张输入推理进行平均,结果大约慢4倍左右。
很奇怪,我在本地也进行了验证,这个版本确实是ORT_GPU比CPU要慢,大约慢了10几倍,不知道您这边有没有头绪
Hi,Sorry to bother you,may i have a copy of datasets for just research, please?thanks a lot, this is my email :([email protected]) @wukaoliu
Hi, I've filled the google form for 24 hours, but i have not received any reply. Please check out. Thank you ! @sagniklp