ZStack Logo

ZStack AIOS

云主机内部监控

完整平台用户手册,包含基础云平台能力与 AIOS 相关章节。

内部监控是性能优化工具从云主机处获取的云主机性能数据,通过曲线图实时动态展示云主机的各项性能指标,包括:CPU、内存、磁盘容量。

监控机制

  • 内部监控数据通过性能优化工具中的内部监控agent获取,查看内部监控需为云主机预先安装性能优化工具,具体安装方法请参考工具安装
  • 获取到的监控数据可通过三层网络DHCP服务或性能优化工具中的QEMU Guest Agent (QGA) 推送到物理机:
    • DHCP服务推送:云主机默认网络开启DHCP服务时,监控数据默认通过DHCP服务推送。
    • QGA推送:云主机默认网络未开启DHCP服务或DHCP服务故障时,监控数据切换由QGA推送。默认网络开启DHCP服务或DHCP服务恢复后,将自动切换回DHCP服务推送监控数据。

图1所示:



图1 内部监控机制
说明:
  • ZStack Cloud 4.7.0之前版本不支持通过QGA推送监控数据。
  • 操作系统与性能优化工具中的QGA组件适配关系请参考云主机性能优化工具适配表。

监控数据 | CPU

支持选择不同的时间跨度来监控云主机CPU的实时使用率。
  • 可选择的时间跨度:15分钟、1小时、6小时、1天、1周、1月、1年、自定义
  • 监控条目:
    • CPU系统进程占用率:实时显示云主机当前内核空间占用的CPU百分比
    • CPU用户进程占用率:实时显示云主机当前用户进程占用的CPU百分比
    • CPU等待占用率:实时显示云主机当前处于等待IO操作的CPU百分比
    • CPU空闲率:实时显示云主机当前处于空闲状态的CPU百分比
    • CPU使用率:实时显示云主机当前处于已使用状态的CPU百分比
  • 监控对象:
    • 全选:将Average和所有单个CPU的实时情况全部显示
    • Average:显示云主机所有CPU的实时使用率的平均值
    • 单个CPU:单个CPU的实时使用率,例如:0、1、2号CPU
图2所示:


图2 CPU实时监控

监控数据 | 内存

支持选择不同的时间跨度来监控云主机内存的实时使用情况。
  • 可选择的时间跨度:15分钟、1小时、6小时、1天、1周、1月、1年、自定义
  • 监控条目:
    • 内存已用容量:实时显示云主机内存的已使用量
    • 内存可用容量:实时显示云主机内存的可使用量
    • 内存空闲容量:实时显示云主机内存的空闲用量
    • 内存总容量:实时显示云主机内存的总容量
    • 内存空闲率:实时显示云主机当前处于空闲状态的内存百分比
    • 内存使用率:实时显示云主机已使用内存的百分比
    说明: 云主机使用Windows 7或Windows Server 2012操作系统且开启内存回收时,此处展示的内存总容量和已用量将包含已被回收到物理机的内存容量。
图3所示:


图3 内存实时监控
说明: 对于内存数据而言,内部监控比外部监控准确性更高,推荐在监控内存数据时使用内部监控。

监控数据 | 磁盘容量

支持选择不同的时间跨度来监控云主机磁盘的实时容量情况。
  • 可选择的时间跨度:15分钟、1小时、6小时、1天、1周、1月、1年、自定义
  • 监控条目:
    • 磁盘使用率:实时显示云主机磁盘的已使用率
    • 磁盘使用量:实时显示云主机已使用磁盘的容量
    • 磁盘空闲率:实时显示云主机磁盘的空闲率
    • 磁盘空闲量:实时显示云主机空闲磁盘的容量
  • 监控对象:
    • 全选:将所有磁盘分区的实时情况全部显示
    • 单个磁盘分区:显示单个磁盘分区的实时容量情况,例如:vda分区
图4所示:


图4 磁盘容量实时监控

管理内部监控

支持通过以下命令管理内部监控agent,从而停止、启动、重启、查询或卸载内部监控服务:
  • 停止服务:service zwatch-vm-agent stop
  • 启动服务:service zwatch-vm-agent start
  • 重启服务:service zwatch-vm-agent restart
  • 查询服务状态:service zwatch-vm-agent status
  • 卸载内部监控服务:
    卸载内部监控agent后,将不再获取内部监控数据及提供内部监控服务。内部监控agent卸载方法区分Linux云主机与Windows云主机,方法分别如下:
    • Linux云主机
      1. 使用service zwatch-vm-agent stop命令停止agent。
      2. 使用rm -f /etc/systemd/system/zwatch-vm-agent.service命令删除service配置文件。
      3. 使用rm -rf /usr/local/zstack/zwatch-vm-agent命令删除agent安装目录。
    • Windows云主机
      1. 删除注册表相关条目。
        以管理员身份运行Windows命令提示符,执行以下命令删除系统中相关键值:
        reg delete HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\MSDTC /f
        reg delete HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\MSDTC /f
        reg delete HKEY_CLASSES_ROOT\CID /f
      2. 停止并重新安装msdtc服务。
        以管理员身份运行Windows命令提示符,执行以下命令停止并重新安装msdtc服务:
        net stop msdtc
        msdtc -uninstall
        msdtc -install
      3. 重新启动云主机。
      4. 卸载agent。
        以管理员身份运行Windows命令提示符,执行以下命令删除agent:
        msiexec /a "c:\Program Files\GuestTools\qemu-ga.msi" targetdir="c:\Program Files"
        "c:\Program Files\QEMU Guest Agent\Qemu-ga\qemu-ga.exe" -s vss-uninstall