devices icon indicating copy to clipboard operation
devices copied to clipboard

是否有指标可以监测到显存、算力使用余量或者消耗量

Open linjianshu opened this issue 1 year ago • 0 comments

在对GPU显卡卡数+算力+显存进行三维调度时,显然volcano自定义调度器已经做了十足的工作确保调度顺利进行,因此请教一个稍微不太专业的问题,在node或其他层面,是否有监控指标可以获取到节点(something else)上显存、算力的余量或消耗量信息呢? 不尽感谢,thanks very much!

linjianshu avatar Dec 24 '24 09:12 linjianshu