cloudpods icon indicating copy to clipboard operation
cloudpods copied to clipboard

[求助/Help]3.10.11控制节点无法开启Hugepage

Open chenjacken opened this issue 1 year ago • 6 comments

1,版本: v3.10.11 高可用新集群部署,参考:https://www.cloudpods.org/docs/getting-started/full/ha-ce

开启内存大页(设置/etc/yunion/host.conf的hugepages_options 为 native):https://www.cloudpods.org/docs/guides/onpremise/vminstance/hugepage#%E9%83%A8%E7%BD%B2%E5%AE%8C%E6%88%90%E5%90%8E%E6%83%B3%E5%BC%80%E5%90%AF%E5%A4%A7%E9%A1%B5

2,其他节点可以开启,但是master1无法开启Hugepage,default-host报错:Host instance init error: Prepare environment: hugepage 1024 nr 0

查看发现: oc-hugetlb-gigantic-pages.service文件不存在 /usr/lib/systemd/oc-hugetlb-reserve-pages.sh文件不存在 /etc/default/grub里也没有hugepagesz=1G default_hugepagesz=1G

是部署过程时候master1存在问题导致的吗?master2和master3都能开启Hugepage。

chenjacken avatar Jan 17 '24 01:01 chenjacken

@chenjacken 重启一下宿主机试试?

zhasm avatar Jan 17 '24 01:01 zhasm

@chenjacken 什么操作系统,设置完成后需要重启宿主机

wanyaoqi avatar Jan 17 '24 02:01 wanyaoqi

@chenjacken 什么操作系统,设置完成后需要重启宿主机

嗯,是有重启过的,其他节点可以 ,就这个不行。 另外,查到另外一个情况是,内核版本是是3的那个,而不是5.4.130-1.yn20230805,是因为部署时候,yum超时没更新到最新的内核版本吗?

chenjacken avatar Jan 17 '24 06:01 chenjacken

@chenjacken 你这个应该是内核没更新,grub 没有更新,没有完整的执行完开启大页的流程。 你想要手动开启大页的话可以从别的机器上拷贝 oc-hugetlb-gigantic-pages.service 服务所需要的文件

# 拷贝到本机并执行这个脚本
$ /usr/local/hugetlb-init/hugetlb_setup.sh

# 拷贝 oc-hugetlb-gigantic-pages.service 服务需要的文件到对应的目录
/usr/lib/systemd/system/oc-hugetlb-gigantic-pages.service
/usr/lib/systemd/oc-hugetlb-reserve-pages.sh
# 启用 oc-hugetlb-gigantic-pages.service 并重启宿主机
$ systemctl enable oc-hugetlb-gigantic-pages.service --now
$ reboot

wanyaoqi avatar Jan 17 '24 06:01 wanyaoqi

根据以上指引内容手工开启成功!

chenjacken avatar Jan 21 '24 03:01 chenjacken

default-host报错:Host instance init error: Prepare environment: hugepage 1024 nr 0

1,环境:v3.11.0 2,操作系统:OpenEuler 22.03 LTS Sp3

宿主机的配置(/etc/yunion/host.conf) hugepages_option=native

default-host报错:Host instance init error: Prepare environment: hugepage 1024 nr 0

chenjacken avatar Mar 09 '24 04:03 chenjacken