cube-studio
cube-studio copied to clipboard
cube studio开源云原生一站式机器学习/深度学习/大模型AI平台,支持sso登录,多租户,大数据平台对接,notebook在线开发,拖拉拽任务流pipeline编排,多机多卡分布式训练,超参搜索,推理服务VGPU,边缘计算,server...
看描述可以支持海光DCU和华为NPU,但是看扩容的时候还是要基于nvidia-docker2,那这样是否只是限定了只可以扩容GPU? 是否存在异构算力统一管理的可能性,如一个集群内包括了NPU和GPU两种架构的计算资源,可以统一管控,不一定统一调度。 谢谢!
cube bug
我们发现登录cube平台之后,如果同一个浏览器上有2个以及以上的页面,在其中一个页面退出,在其他页面刷新直接报错500
目前提供的版本是0.6.0 但是官方已经放出了0.9.0 有什么方法能自己添加镜像吗
fixed #111
Signed-off-by: tghfly222
 我这边要怎么移除这个wait Pod ?
time="2023-04-18T06:56:06.422208283Z" level=info msg="Wrote kubeconfig /etc/rancher/k3s/k3s.yaml" time="2023-04-18T06:56:06.422266583Z" level=info msg="Run: k3s kubectl" time="2023-04-18T06:56:06.422279183Z" level=info msg="k3s is up and running" time="2023-04-18T06:56:06.422339183Z" level=warning msg="Failed to find cpuset cgroup, you may need to add \"cgroup_enable=cpuset\"...
单机K8s部署后,cube前端页面过十几分钟就不能访问了,需要重启pod才行,是什么情况啊。 去rancher管理界面查看相关pod日志, frontend pod不显示日志 rancher管理界面显示服务器都是active。但前端页面就是无法访问。