资源监控

资源性能监控

概述

ZStack Cube 虚拟化版 提供可视化图表展示资源在一段时间内的各项监控数据。这些图表包含多个关键性能监控指标,帮助您直观了解资源性能状况。

监控图表类型

图表类型 描述
条形图 以比例条形图方式可视化展示资源容量负载的监控数据,直观了解资源容量信息。
曲线图 以曲线图方式可视化展示资源各项负载的监控数据,直观了解资源健康状况。

监控数据获取方式

ZStack Cube 虚拟化版 为虚拟机提供两种监控方式。通常而言,对于内存数据,高级监控比基础监控又更好的准确性,推荐在监控内存数据时使用高级监控。
  • 基础监控:由 Libvirt 从主机处获取监控数据。
  • 高级监控:由高级监控 agent 从虚拟机处获取监控数据。需预先在虚拟机上安装 VMTools。

监控数据收集时间间隔

ZStack Cube 虚拟化版 采用实时监控方式,资源监控图表默认每 10 秒刷新一次数据。

容量信息监控

ZStack Cube 虚拟化版 提供各类计算和存储资源容量使用和分配信息,包括虚拟机、主机、集群、数据存储、数据中心、根结点(管理节点)资源,方便您从微观和宏观两个维度全面了解平台资源使用情况。

容量监控指标

您可前往对应资源的总览详情页,从容量信息卡片中了解平台资源使用情况。
对象 监控指标及描述
根节点
  • CPU:所有数据中心下物理 CPU 总赫兹以及平均使用率。
  • 内存:所有数据中心下物理内存总量、平均使用率、以及剩余可用量。
  • 存储:所有数据中心下物理存储总量、平均使用率、以及剩余可用量。
数据中心
  • CPU:数据中心下物理 CPU 总赫兹以及平均使用率。
  • 内存:数据中心下物理内存总量、平均使用率、以及剩余可用量。
  • 存储:数据中心下物理存储总量、平均使用率、以及剩余可用量。
数据存储
  • 存储使用率:数据存储的存储资源总量、使用率、以及剩余可用量。
  • 存储分配比:数据存储的存储资源分配情况。
  • 存储分布:数据存储的存储资源分布情况,包括:超配后总量、预留容量、已分配量(包括:快照容量、镜像缓存、迁移存储、虚拟机硬盘容量等)、以及剩余可分配量。
集群
  • 资源使用率:集群下所有物理 CPU 和物理内存资源总量、使用率、以及剩余可用量。
  • 资源分配比:集群下所有物理 CPU 和内存资源分配情况。
  • 资源分布:集群超配后 CPU 与内存资源分布情况,包括:超配后总量、预留容量、已分配量以及剩余可分配量。
主机
  • 资源使用率:主机物理 CPU 、物理内存和物理存储资源总量、使用率、以及剩余可用量。
  • 资源分配比:主机 CPU 、内存和存储资源分配情况。
  • 资源分布:主机超配后 CPU、内存以及存储资源分布情况,包括:超配后总量、预留容量、已分配量以及剩余可分配量。
虚拟机
  • CPU:虚拟机 CPU 核数以及使用率
  • 内存:虚拟机内存总量、已使用量、以及剩余可用量。
  • 存储:虚拟机存储总量、已使用量、以及剩余可用量。

容量计算公式

类别 计算公式
资源使用率 CPU 总量 = 物理核数 × 单核 GHz
资源分配比
  • 分配比 = 可分配 : 可超配总量
  • 可超配总量 = 物理总量 − 预留物理容量
  • 可分配总量 = 可超配总量 × 超配比
  • 剩余可分配 = 可分配总量 − 已分配
资源分布 CPU
  • CPU 超配后总量 = 物理 CPU 总量 × 超配比
内存
  • 内存超配后总量 = 保留内存 + 可分配内存总量
  • 可分配内存总量 = (物理内存总量 − 保留内存) × 超配比
存储
  • 存储超配后总量 = 保留容量 + 可分配存储总量
  • 可分配存储总量 = (物理存储总量 − 保留容量) × 超配比
超配与分配的含义如下:
  • CPU 超配:表示可将一个物理 CPU 核最多虚拟成 N 个逻辑 CPU 核,分配给虚拟机使用。

    例如,若 CPU 超配比为 2:1,则一个物理 CPU 核最多可虚拟成 2 个逻辑CPU核。因此,若主机有 10 个物理 CPU 核,最多可虚拟成 20 个逻辑 CPU 核,再分配给虚拟机使用。

  • 内存/存储超配:表示可将一个单位的内存/存储容量最多虚拟成 N 个单位的内存/存储容量,分配给虚拟机使用。

    例如,若内存/存储超配比为 2:1,则 1 GB 内存/存储容量最多虚拟成 2 GB 的内存/存储容量。因此,若主机内存/存储为 100 GB,可虚拟成 200 GB 内存/存储,再分配给虚拟机使用。

  • CPU 分配:表示一个物理 CPU 核实际虚拟成 N 个逻辑 CPU 核给虚拟机使用。因此,CPU 分配比 ≤ CPU 超配比。

    例如,若 CPU 分配比为 1.5:1,则一个物理 CPU 核实际虚拟成 1.5 个逻辑CPU核。因此,若主机有 10 个物理 CPU 核,则实际已虚拟成 15 个逻辑CPU核,分配给虚拟机使用。

  • 内存/存储分配:表示一个单位的内存/存储容量实际虚拟成 N 个单位的内存/存储容量。因此,内存/存储分配比 ≤ 内存/存储超配比。

    例如,若内存/存储超配比为 1.5:1,则 1GB 内存/存储容量实际虚拟成 1.5 GB 的内存/存储容量。因此,若主机内存/存储为 100 GB,实际已虚拟成 150 GB 内存/存储,分配给虚拟机使用。

以主机存储为例,若物理存储总量为 100 GB,保留物理容量为 10 GB,超配比为 2:1,已分配为 150 GB,则:
  • 存储分配比 = 150 GB : 90 GB = 1.67
  • 可超配存储总量 = 100 GB − 10 GB = 90 GB
  • 可分配存储总量 = 90 GB × 2 = 180 GB
  • 剩余可分配存储量 = 180 GB − 150 GB = 30 GB

查看监控图表

ZStack Cube 虚拟化版 支持以曲线图方式可视化查看各资源的负载监控数据,不仅可以帮助您快速了解资源对象的计算、存储、网络资源的库存,而且方便您直观了解资源的健康状况。

操作步骤

  1. 在导航栏中,选择资源清单
  2. 选择一个有效的资源对象,例如虚拟机、主机、集群、镜像存储、数据存储、分布式端口组。
  3. 在右侧页面,点击监控
  4. (可选)选择需要展示的监控条目。
  5. (可选)选择或自定义时间范围。
  6. (可选)选择单个或多个监控对象。

自定义监控图表

您可以自定义监控图表,以查看更多监控数据。
  • 详细信息:将鼠标悬停在图表上方,即会显示相关数据点的详细信息。
  • 自定义时间跨度:默认展示 15 分钟内的监控数据。可选值:15 分钟、1 小时、6 小时、1 天、1 周、1 月、1 年、自定义。
  • 自定义监控条目:根据业务需求灵活选择您要关注的监控指标。如需了解完整监控条目,请参阅 监控条目附录
  • 自定义监控对象:展示全部或指定监控对象的数据。
  • 自定义监控图表位置:自由拖拽排列监控图表位置。

监控条目附录

对象 监控指标 监控条目及描述
集群
  • CPU
  • 内存
  • 硬盘
  • 网卡
  • 全部 CPU 使用率
  • 内存使用百分比
  • 全部硬盘 IOPS(读/写)
  • 全部网卡数据传输速度(发送/接收)
主机 CPU
  • CPU 使用率:CPU 处于非空闲状态的时间比例
  • CPU 空闲率:CPU 处于空闲状态的时间比例
  • CPU 系统进程占用率:CPU 运行在内核空间的时间比例,典型的内核操作有:分配内存、I/O 操作、创建子进程等
  • CPU 用户进程占用率:CPU 运行在用户态空间的时间比例,典型的用户态空间程序有:Shells、数据库、Web 服务器等
  • CPU 等待进程占用率:CPU 发起读写操作后,等待硬盘驱动器将数据读入内存的时间比例
内存 内存使用量:资源内存的使用量和空闲量
硬盘
  • 硬盘速度:资源硬盘读写速度
  • 硬盘 IOPS:资源硬盘读写 IOPS
  • 硬盘时延:资源硬盘时延
  • 主机全部硬盘使用率:主机全部硬盘已使用容量百分比
  • 主机全部硬盘使用量:主机全部硬盘已使用容量
  • 平台系统文件所占硬盘使用率:平台系统文件所占硬盘容量百分比
  • 平台系统文件所占硬盘使用量:平台系统文件所占硬盘容量
网卡
  • 网卡数据速率:资源当前网卡的发送和接收速率
  • 网卡包速率:资源当前网卡的发送包和接收包速率
  • 网卡包丢弃速率:资源当前网卡的出包和入包丢弃速率
虚拟机 CPU
  • CPU 使用率:CPU 处于非空闲状态的时间比例
  • CPU 空闲率:CPU 处于空闲状态的时间比例
  • CPU 系统进程占用率:CPU 运行在内核空间的时间比例,典型的内核操作有:分配内存、I/O 操作、创建子进程等
  • CPU 用户进程占用率:CPU 运行在用户态空间的时间比例,典型的用户态空间程序有:Shells、数据库、Web 服务器等
  • CPU 等待进程占用率:CPU 发起读写操作后,等待硬盘驱动器将数据读入内存的时间比例
内存
  • 内存使用量:资源内存的使用量和空闲量
  • 内存可用容量:资源内存的可使用量
  • 内存空闲量:资源内存的空闲容量
  • 内存总容量:资源内存的总容量
  • 内存空闲率:资源当前处于空闲状态的内存百分比
  • 内存使用率:资源已使用内存的百分比
硬盘
  • 硬盘速度:资源硬盘读写速度
  • 硬盘 IOPS:资源硬盘读写 IOPS
  • 硬盘使用率:资源硬盘的已使用率
  • 硬盘空闲率:资源硬盘的空闲率
  • 硬盘使用量:资源已使用硬盘的容量
  • 硬盘空闲量:资源空闲硬盘的容量
网卡
  • 网卡数据速率:资源当前网卡的发送和接收速率
  • 网卡包速率:资源当前网卡的发送包和接收包速率
  • 网卡包丢弃速率:资源当前网卡的出包和入包丢弃速率
数据存储 容量

已用容量百分比:资源当前已使用的容量百分比

镜像存储-单机镜像仓库/分布式镜像仓库 容量

已用容量百分比:资源当前已使用的容量百分比

镜像存储-单机镜像仓库 CPU
  • CPU 使用率:CPU 处于非空闲状态的时间比例
  • CPU 空闲率:CPU 处于空闲状态的时间比例
  • CPU 系统进程占用率:CPU 运行在内核空间的时间比例,典型的内核操作有:分配内存、I/O 操作、创建子进程等
  • CPU 用户进程占用率:CPU 运行在用户态空间的时间比例,典型的用户态空间程序有:Shells、数据库、Web 服务器等
  • CPU 等待进程占用率:CPU 发起读写操作后,等待硬盘驱动器将数据读入内存的时间比例
硬盘
  • 硬盘速度:资源硬盘读写速度
  • 硬盘 IOPS:资源硬盘读写 IOPS
内存 内存使用量:资源内存的使用量和空闲量
网卡
  • 网卡数据速率:资源当前网卡的发送和接收速率
  • 网卡包速率:资源当前网卡的发送包和接收包速率
  • 网卡包丢弃速率:资源当前网卡的出包和入包丢弃速率
分布式端口组 IP
  • 已用 IP 百分比(IPv4):资源当前已使用的 IPv4 地址百分比
  • 可用 IP 百分比(IPv4):资源当前剩余可用的 IPv4 地址百分比

主页监控

ZStack Cube 虚拟化版 主页以卡片方式展示平台内资源状态统计、平台负载趋势、平台用量统计、资源 Top 排行、用户信息、近七日未读告警统计等信息。
  • 每次进入或刷新主页均能获取最新数据并实时展示。此外,图表类模块默认每 30 秒自动刷新一次数据。
  • 默认展示当前数据中心的资源数据,您可点击页面左上角切换按钮,指定展示数据中心的资源数据。
  • 状态统计类图表采用统一的色彩规范。绿色表示正常状态、红色表示异常状态、灰色表示其他状态。
  • 百分比进度条包括蓝(小于 60%)、黄(大于等于 60% 并且小于 80%)、红(大于等于 80%)三色,直观展示当前资源的使用状态。
  • 对于资源状态统计卡片以及部分负载趋势和用量统计卡片,支持点击资源名称或统计数字跳转至对应资源页面。

双管理节点监控

若您的环境为双管理节点环境,可导航至可靠服务 > 监控节点监控页面,查看管理节点监控数据。

在您查看管理节点监控数据前,可提前了解以下信息:
  • 此页面包括绿色、红色、灰色三种颜色。其中,绿色表示正常;其他颜色均表示异常。
  • 双管理节点采用主备模式,主管理节点只有一个。显示VIP的为主管理节点,未显示VIP的均为备管理节点。
  • 若所有备管理节点状态异常,主管理节点故障后,无法切换且管理节点宕机。因此,若发现存在管理节点异常,请及时处理。
管理节点监控支持显示双管理节点的管理节点IP、节点状态、VIP和管理服务状态,主要包括以下几种管理服务:
  • 仲裁网关是否可达

    监控用于判断主备管理节点的仲裁IP是否可达,若不可达可能导致管理节点高可用功能失效。

  • 对端管理节点是否可达

    监控备管理节点是否可达,若备管理节点不可达,无法与备管理节点通信。

  • VIP是否可达

    监控VIP是否可达,若VIP不可达,主管理节点不能通过VIP访问UI界面。

  • 数据库状态

    监控数据库状态,若数据库异常,可能存在数据丢失风险,请及时恢复故障。

主机硬件监控

ZStack Cube 虚拟化版 支持监控主机硬件组件的状态,例如 CPU、内存、传感器、PCIe 设备等。

主机可监控的硬件包括:
  • CPU
  • 内存
  • 物理硬盘
  • 物理网卡
  • GPU 设备
  • 块设备
  • USB 设备
  • 传感器(电压、电流、风扇、温度)
  • 电源
  • PCIe 设备