huyutuo

Results 2 comments of huyutuo

不太清楚在suspend-resume过程中,如何实现的,在论文中提到需要将GPU内的一些信息转移至CPU,然后再进行挂起,我有个问题,如何将GPU内的信息转移至CPU啊 谢谢

> 这篇论文是北邮的博士学长的一作,据说有开源的计划,可以期待一下。 > > 论文是基于这样几个 key insight: > > * 深度学习是反馈驱动的探索,用户经常运行一批训练,取其中结果最好的。这个可以理解为是类似参数搜索,模型结构搜索这样的场景。 > * 在资源使用的异构性,导致很难得到最优解 > * intra-job predictability,这是全文比较关键的一个概念,如下图所示,GPU 的内存使用存在一定的周期性 > > ![screenshot from 2018-11-08 17-06-44](https://user-images.githubusercontent.com/5100735/48188419-b4945200-e378-11e8-8322-f4c721173cd5.png) > > 论文在不同方面利用了第三个 key insight,针对场景做了一些优化,主要是为机器学习工作负载的调度增加了几个新的原语,包括对...