ZStack Logo

ZStack AIOS

集群高级设置

完整平台用户手册,包含基础云平台能力与 AIOS 相关章节。

ZStack Cloud支持在集群粒度对相关参数进行高级设置,如表1所示:
表1 集群高级设置
名称 简介 默认值 说明
CPU超分率
  • 用于控制分配给云主机的虚拟CPU数量。
  • 计算公式:物理CPU总线程 X CPU超分率 = 可分配的虚拟CPU数量
  • 数值过小可能会导致可用资源变成负数,以及首页展示的百分比大于100%,请设置合理的超分率。
10
  • 举例说明:

    若物理CPU为四核八线程,CPU超分率为10,系统会将物理CPU总线程(8)乘以CPU超分率(10),计算得到可分配的虚拟CPU数量(80)。

  • 请按需配置CPU超分率。
    说明: CPU超分率过大可能严重影响物理机性能,导致业务卡顿。
  • 虚拟CPU总数可在首页的CPU卡片查看。
内存超分率
  • 用于控制分配给云主机的虚拟内存容量。
  • 计算公式:物理内存容量 X 内存超分率 = 可分配的虚拟内存容量。
  • 数值过小可能会导致可用资源变成负数,以及首页展示的百分比大于100%,请设置合理的超分率。
1
  • 内存超分率取值范围:[1.00, 1000.00] (精确度:0.01)。
  • 举例说明:

    若物理内存为4GB,内存超分率为1.10,系统将分配4.4GB虚拟内存给云主机使用。

  • 请按需配置内存超分率。
    说明:
    • 内存超分率过大可能会严重影响物理机内存性能,导致系统OOM(内存溢出)。
    • 内存超分率≤1.0时,集群内的云主机无法开启内存气球或KSM内存同页合并,已开启的内存气球和KSM内存同页合并功能不再生效。
  • 生产环境中,若用户已设置内存超分,建议在安装系统时,配置相应的swap分区。
    • 举例说明:

      若物理内存为100GB,内存超分率为2.00,建议设置swap分区为100GB,这样将有足够的swap空间供内存超分使用。

物理机保留内存 用于设置集群内所有KVM物理机上保留的内存容量。 8GB
  • 物理机保留内存建议可用单位:TB/GB/MB。
  • 支持在全局设置或物理机粒度设置物理机保留内存,生效优先级为:物理机粒度>集群粒度>全局设置粒度。
  • 若物理机未单独设置:
    • 若集群未开启大页内存,修改该设置后需重连对应物理机生效。
    • 若集群开启大页内存,修改该设置后需重启对应集群中的物理机生效。
  • 使用集群大页功能时,设置物理机保留内存需注意:
    说明:
    • 集群启用大页后,若集群内物理机保留内存低于4GB,将自动调整为4GB,并将物理机剩余内存全部分配为大页内存。
    • 大页内存只能被云主机使用,请合理设置物理机保留内存,若保留内存过小,会导致物理机系统服务异常,例如在超融合场景下,建议物理机保留内存设置为16GB以上。
集群大页开关 用于设置集群大页功能是否启用。 false
  • 若为true,集群中所有物理机将启用大页(每页为2MB),且将大页空间分配给云主机。
  • 使用集群大页功能需注意:
    说明:
    • 集群启用大页,前提需确保集群内所有物理机进入维护模式。
    • 该功能启用后,需重启物理机生效。
    • 若打开该开关后修改了集群内某一物理机内存,需重新打开该开关且重启物理机,使该开关生效。
    • 集群启用大页后,若集群内物理机保留内存低于4GB,将自动调整为4GB,并将物理机剩余内存全部分配为大页内存。
    • 大页内存只能被云主机使用,请合理设置物理机保留内存,若保留内存过小,会导致物理机系统服务异常;在超融合场景下,需考虑存储 OSD 占用、管理节点服务占用、系统占用等预留,例如使用 5 个 OSD,建议保留内存设置为 50GB(包括:25GB-存储 OSD 占用,15GB-管理节点服务及系统占用,10GB-存储管理占用)。
    • 开启内存大页后,集群内的云主机将无法开启KSM内存同页合并或内存气球,已开启的KSM内存同页合并和内存气球不再生效。
云主机Hyper-V开关 云主机Hyper-V模拟的开启或关闭。 false 若云主机已单独设置该选项,此集群设置将不对该云主机生效。
隐藏KVM虚拟化标记 云主机KVM虚拟化标记的开启或关闭。 false 若为true,则会在新启动云主机定义XML中对<kvm>插入<hidden state='on'>,若为false则不会。
说明: NVIDIA显卡集群需启用该开关。
动态资源调度开关 动态资源调度功能是否启用。 KVM集群默认为true;非KVM集群默认为false
  • 开启后可在动态资源调度页面配置调度策略。
  • 开启动态资源调度需同时满足以下条件:
    说明:
    • 确保集群内仅存在Ceph、Shared Block类型的主存储。
    • 确保集群内所有物理机CPU型号一致。
Zero Copy开关 是否开启集群Zero Copy开关。 false 开启后将减少数据在内核态和用户态之间的拷贝次数,降低CPU占用时间,提升虚拟网卡性能。
说明: 可通过在物理机终端执行cat /sys/module/vhost_net/parameters/experimental_zcopytx命令验证该设置当前的状态:
  • 若返回值为1,则表示该设置为开启状态。
  • 若返回值为0,则表示该设置为关闭状态。
  • 若返回No such file or directory,请等待平台服务正常运行后重新验证。
网卡多队列优化开关 用于设置是否开启云主机网卡多队列优化。 true 开启后,系统将在云主机首次启动时,根据Linux云主机的CPU数量对其网卡多队列数量进行自动优化(最多12个队列),提升云主机性能。
网卡多队列数目 用于设置Virtio类型的网卡流量分配给多个CPU时的队列数目。 1
  • 取值范围[1,256]之间的整数。
  • 举例说明:

    当Virtio类型网卡流量分配给多个CPU时,设置256即分为256个队列进行处理。

云主机Hypervisor 用于设置是否开启云主机CPU虚拟化 (hypervisor) 标记 true
  • 如设置为false,将关闭云主机CPU虚拟化标记,跳过应用程序对云主机的虚拟化环境检测。
  • 如已对云主机进行单独设置,该集群设置对该云主机不生效。
资源绑定策略 设置集群下云主机、路由器和当前集群的绑定程度,及跨集群迁移限制。仅对已开启集群绑定的资源生效 弱绑定
  • 弱绑定:云主机/VPC 路由器默认在本集群启动,本集群资源不足时,云主机/VPC 路由器将启动失败。允许手动将云主机/VPC 路由器迁移到其他集群。
  • 强绑定:云主机/VPC 路由器只能在本集群启动,本集群资源不足时,云主机/VPC 路由器将启动失败。不允许手动将云主机/VPC 路由器迁移到其他集群。
说明: 如资源未开启集群绑定,该设置对该资源不生效。
云盘多队列配置 为本地存储、NFS、Vhost、Ceph、SharedBlock以及AliyunEBS主存储中的云盘设置队列数,用于提高数据传输效率。 false 设置云盘队列数量,有效范围:1~128.
  • 建议设置的队列数不要超过云主机vCPU数量,超出部分将不生效。
  • 修改队列数后,为使新配置生效,需要重新加载云盘。