tf_repos icon indicating copy to clipboard operation
tf_repos copied to clipboard

DeepFM gpu利用率问题

Open laochangxin opened this issue 7 years ago • 3 comments

lambdaji你好~一直有关注你的知乎和tf_repos,最近在实践中利用DeepFM实现了一个排序模型,想请教一个实际运用的问题,请问你在实际运用中是否会出现GPU利用率的问题?我这边在训练过程利用率始终在10%以下,如果单GPU资源利用都达不到100%,分布式也就没意义了。。。我用的是Tesla P40,显存有24G,显存应该不是瓶颈,数据规模field有81,feature index大约是百万级,对利用率问题一直不解,还望指教,多谢!

laochangxin avatar Aug 01 '18 09:08 laochangxin

我们场景网络规模没那么大,没上GPU,给不了你实用的建议。参考下https://zhuanlan.zhihu.com/p/31558973

lambdaji avatar Aug 05 '18 06:08 lambdaji

好的,多谢~ 从我这边实验多份数据的结果看,还是因为输入的特征维度过大,需要的存储也更大,这么看在大规模稀疏特征集合下用GPU效率上并没有什么收益

laochangxin avatar Aug 06 '18 05:08 laochangxin

我也碰到这个问题,请教下你是怎么解决的。。

mathlf2015 avatar Jan 15 '19 09:01 mathlf2015