Results 21 comments of fangpsh

> ee5d5ce8 Hi,hoganlxj,感谢指导。显示如下: ``` # ls -al /opt/cloud/workspace/disks/image_cache/ |grep ee5d5ce8 -rw-r--r-- 1 root root 33852020224 Aug 30 10:28 ee5d5ce8-6c8b-487a-8a15-2a3974ae4d1c -rw-r--r-- 1 root root 230 Aug 30 10:31 ee5d5ce8-6c8b-487a-8a15-2a3974ae4d1c.inf ``` inf...

> climc image-show ee5d5ce8-6c8b-487a-8a15-2a3974ae4d1c 确实,这个报错了: ``` # climc image-show ee5d5ce8-6c8b-487a-8a15-2a3974ae4d1c {"error":{"code":404,"details":"404 Not Found","request":{"headers":{"User-Agent":"yunioncloud-go/201708","X-Auth-Token":"*"},"method":"HEAD","url":"https://192.168.8.8:30292/v1/images/ee5d5ce8-6c8b-487a-8a15-2a3974ae4d1c"}}} ```

> 确实是我们的问题,我们近期修复下 Hi,这个问题升级到tag/v3.11.3 后依然存在。

这类主机,大都是之前从 pve 制作 qcow2 镜像导入,创建之后,删除了原始镜像。 ee5d5ce8-6c8b-487a-8a15-2a3974ae4d1c 在glance/images 中的数据: ``` 2023-08-30 01:59:58 2023-09-08 07:47:21 134 2023-09-08 07:47:21 1 ee5d5ce8-6c8b-487a-8a15-2a3974ae4d1c 0 VM-100.181 deleted 0 default e9ab6f037e1843b28fcf847bf6a3a9a5 local 0 2023-09-05 06:58:31 1 0...

> @fangpsh 是不是手动删除过镜像和缓存的镜像?平台不会自动删除这些记录 是的,创建机器成功之后,就手动删除了导入的镜像。是由于这个原因导致迁移失败?

关联:https://github.com/yunionio/cloudpods/issues/20880 创建镜像或者主机快照后再创建新机器,可绕过。

> > 目前每次执行升级,担心有其他同学在操作,需要在群里说下,开始升级,不要开机、配置等变更。 > > @fangpsh 这个步骤是没有问题的,因为升级过程中会重启服务,如果当时正好存在比如迁移虚拟机的长期任务,就会出现一个中间态,导致迁移失败。 > > 但后端服务有很多,升级过程中可能前端根本没法访问,或者一些 api 调用报错,所以就算设置了全局只读模式,还是可能会出现报错。 多谢解答。 更新是滚动渐进的,所以可能出现前端服务已恢复的情况下(即登录 web 端无明显报错),但是某些宿主机的 host-deply 服务还在滚动更新。这个时候如果有人下发任务,可能会有异常?。 如果这个只读逻辑实现太复杂的话,可否直接 redirect 到一个单独的维护页面。然后在那个维护页面,只有管理员可以解除维护?

应该是`[fatal 2023-07-20 07:43:02 hostman.(*SHostService).RunService(host_services.go:79)] Host instance init error: Prepare environment: hugepage 1024 nr 0` 这行日志的问题,no block device avaiable 不会导致退出。 和https://github.com/yunionio/cloudpods/issues/17523 类似问题。

``` cat /proc/meminfo | grep -i huge AnonHugePages: 141312 kB ShmemHugePages: 0 kB FileHugePages: 0 kB HugePages_Total: 0 HugePages_Free: 0 HugePages_Rsvd: 0 HugePages_Surp: 0 Hugepagesize: 2048 kB Hugetlb: 0 kB...