cloudpods icon indicating copy to clipboard operation
cloudpods copied to clipboard

[BUG] 使用镜像创建虚拟机时一直在缓存镜像中,超过2个小时就直接失败?

Open xxhacker opened this issue 10 months ago • 8 comments

我有一个虚拟机使用的镜像是从别的地方导入过来的大概1T左右,在创建的时候不管是系统盘还是数据盘都我都指定使用ceph,但一直卡在了缓存镜像中,我观察有几下现象如图: 1712895557168 不知道上面的缓存列表有什么作用? 1712895628665(1) 我明明指定创建虚拟机使用的空间在是ceph,不知道为何跑到了某一台计算节点上了(好像是随机指定的一台),且这个文件一直增加,感觉是缓存到这里来了

xxhacker avatar Apr 12 '24 04:04 xxhacker

@xxhacker 用新镜像第一次新建虚拟机,是先把镜像缓存宿主机上,后面再新建虚拟机就会用镜像存储。 1T的镜像镜像,上传到宿主机比较慢,可以再等等

hoganlxj avatar Apr 12 '24 09:04 hoganlxj

@hoganlxj 今天上传了一天了,还是没有上传好,好像这个缓存到40%左右的时候,也就是这个tmp缓存临时文件到540G的时候,就失败了,我看一下系统磁盘占用率为66%左右,还有差不多300多G的空间,报错日志如下: { "reason": { "reason": { "reason": { "reason": "{"reason":{"reason":"{\"reason\":{\"reason\":{\"image_id\":\"55e825c5-5cc2-4007-89e3-ad651802ba56\",\"reason\":{\"reason\":\"AcquireImage: LocalStorage.AcquireImage: remoteFile.Fetch: download: io.Copy to tmpPath /opt/cloud/workspace/disks/image_cache/55e825c5-5cc2-4007-89e3-ad651802ba56.tmp from reader: unexpected EOF\",\"stage\":\"OnImageCacheComplete\",\"status\":\"error\"}},\"stage\":\"OnImageCacheComplete\"},\"stage\":\"OnStorageCacheImageComplete\",\"status\":\"error\",\"task_name\":\"StorageCacheImageTask\"}","stage":"OnStorageCacheImageComplete"},"stage":"on_kvm_disk_prepared","status":"error","task_name":"DiskCreateTask"}", "stage": "on_kvm_disk_prepared" }, "stage": "on_disk_prepared", "status": "error", "task_name": "KVMGuestCreateDiskTask" }, "stage": "on_disk_prepared" }, "stage": "OnDiskPrepared", "status": "error", "task_name": "GuestCreateDiskTask" }

xxhacker avatar Apr 12 '24 09:04 xxhacker

能过几次查看我发现,如果缓存时候超过2个小时就失败了,是不是有什么超时设置? Quicker_20240413_091610 Snipaste_2024-04-13_09-17-57 Snipaste_2024-04-13_09-19-33

xxhacker avatar Apr 13 '24 01:04 xxhacker

https://github.com/yunionio/cloudpods/pull/19976 按这个改下,更新下glance服务

ioito avatar Apr 15 '24 02:04 ioito

@ioito 按照#19976 代码更新了一下glance服务,把超时时间设置为8个小时,我看日志显示镜像缓存已经100%了,但查看虚拟机的状态还是在缓存镜像中且进度条一动也不动了好几个小时了,一直是83.33%,不知道什么原因,这个/opt/cloud/workspace/disks/image_cache目录下的文件还是tmp,也没有日志报错或者不知道在哪里看日志了 Snipaste_2024-04-15_23-18-17 Snipaste_2024-04-15_23-19-20 Snipaste_2024-04-15_23-39-02

xxhacker avatar Apr 15 '24 15:04 xxhacker

是否创建时选了共享存储,例如ceph,如果是,83.33%之后需要把镜像导入到ceph中

ioito avatar Apr 16 '24 03:04 ioito

@ioito 后端是ceph,就是这个镜像比较大缓存比较久,现在的状态是在分配磁盘中,由于这个镜像比较大,所以分配磁盘时间也相当久,不知道能在哪里可以查看分配磁盘的进度,已经分配了快24小时了

xxhacker avatar Apr 17 '24 01:04 xxhacker

目前没有地方展示导入镜像到ceph的进度

ioito avatar Apr 17 '24 02:04 ioito

If you do not provide feedback for more than 37 days, we will close the issue and you can either reopen it or submit a new issue.

您超过 37 天未反馈信息,我们将关闭该 issue,如有需求您可以重新打开或者提交新的 issue。

github-actions[bot] avatar May 25 '24 01:05 github-actions[bot]