Zexi Li

Results 204 comments of Zexi Li

需要补充为什么vmware宿主机没有同步下来的问题

@fangpsh 感谢反馈,这种每个 worker 节点起一个 haproxy/nginx ,upstream 是上游的 apiserver 的架构是会好点,这个改动目前需要花点时间,实现后会在这里同步。

> debian的安装逻辑也有问题,应该把[https://github.com/yunionio/ocboot/blob/master/onecloud/roles/common/tasks/debian.yml#L50的controlplane_host更改为node_ip,因为get](https://github.com/yunionio/ocboot/blob/master/onecloud/roles/common/tasks/debian.yml#L50%E7%9A%84controlplane_host%E6%9B%B4%E6%94%B9%E4%B8%BAnode_ip%EF%BC%8C%E5%9B%A0%E4%B8%BAget) version tag时keepalived还没起来,这个时候根本没有节点持有controlplane_host这个ip。 @zhasm 看下这个地方的代码,确实有问题,version_tag 不应该从 k8s 里面获取,ocboot 部署脚本能知道安装或者升级指定的版本。

@sun3book 目前这个自动配置 VGPU 的问题比较麻烦,特别是 NVIDIA 的驱动配置,这个需求我们之后考虑下怎么做。 /keep-state

@fangfenghuang 目前没有计划纳管 kubevirt 的虚拟机。 kubevirt 应该是直接用的 k8s 的 CRD 机制来管理的,理论上是可以通过把这些 kubevirt 相关 CRD 通过 k8s 的 dynamic client SDK 把相关虚拟机信息拿过来管理。

> `ocboot.py install ./config.yml` > > 现在主要是看示例:https://github.com/yunionio/ocboot/tree/release/3.10 猜测几个选项和大概意思,是否有相关选项的具体文档?搜了下没搜到,可否 补充一个方便用户了解配置的含义和自定义编写。 @fangpsh 收到,这个文档我们添加下

@wanyaoqi 看下这个问题,我们能否判断当前操作系统是否支持开启 hugepage ,如果可以判断的话可以避免这个问题。

> 建议 all in one 模式采用 rancher 和 rainbond 等竞品的运行模式。 他们都是只启用了一个容器,然后内部的组件都是使用 k3s 以及 containerd 部署,相比来说就相当于一个精简的单机 k8s 集群,比现有的 docker-compose 拉起多个集群的方式更直观,也更省资源 @mx2913 这个建议不错,我测试下

感谢反馈,这个问题应该是 baremetal agent task 队列满了导致,需要修改代码优化。

> @zexi 您好,这个队列的问题目前解决了么?我这里也遇到了同样的问题,删除baremetal-agent pod 重启baremetal服务,之后再删除就可以了 @liyibo123456 目前还没有解决,我这边处理完手头的任务回来看这个问题。