ZStack Logo

ZStack AIOS

概述

完整平台用户手册,包含基础云平台能力与 AIOS 相关章节。

一键巡检:对云平台关键资源和服务进行全方位一键式健康检查,并根据巡检结果为巡检资源和服务进行健康评分,同时提供巡检建议和巡检报告,助力高效运维,确保云平台资源和服务处于最佳状态。一键巡检适用于需要对平台进行集中高效运维场景。

图1所示:


图1 一键巡检

功能原理

  • 巡检类别和巡检项
    一键巡检提供平台、计算、网络、存储、全局设置五大类别巡检项,支持对管理节点、物理机和云主机、镜像服务器和主存储、物理/虚拟网络和网卡、许可证等平台关键资源和服务进行巡检:
    • 平台:检测平台基础服务和运行状态。
    • 计算:检测平台物理计算资源和虚拟化计算资源使用状况和运行状态。
    • 网络:检测平台物理网络和虚拟化网络配置和状态。
    • 存储:检测平台物理存储资源使用状况和运行状态。
    • 全局设置:检测平台全局性重要资源的配置情况。

    用户可自定义根据类别选择巡检项进行一键巡检,启动巡检后,平台将对所选择的巡检项涉及的资源或服务进行健康检查。详细巡检项信息可参考巡检项总览

  • 巡检结果
    一键巡检针对所巡检的资源或服务提供四种巡检结果,分别为正常、警告、故障和失败。
    • 正常:所巡检的资源或服务处于正常状态,通过绿色图标标识。
    • 警告:所巡检的资源或服务状态欠佳,可能会在一定程度上影响相关资源和服务的性能和稳定性,通过黄色图标标识。
    • 故障:所巡检的资源或服务状态非常危险,可能会严重影响业务的运行,通过红色图标标识。
    • 失败:资源或服务巡检失败,可能会严重影响业务的运行,通过灰色图标标识。
  • 健康评分

    一键巡检内置健康评分机制,支持对所巡检的资源或服务的健康状态进行量化评分,帮助用户直观准确把握平台整体运行状态。

    巡检资源/服务评分:根据资源或服务的巡检结果进行评分。
    • 若某资源/服务所有巡检属性均正常,该资源/服务的巡检结果为正常,评分为100分。
    • 若某资源/服务存在一个巡检属性处于警告状态,其他巡检属性均正常,该资源/服务的巡检结果为警告,评分为50分。
    • 若某资源/服务存在一个巡检属性处于故障或失败状态,该资源/服务的巡检结果为故障或失败,评分为0分。
    巡检项评分:根据巡检项所涉及资源或服务的评分进行统计。
    • 若巡检项非全局设置类别,该巡检项按照如下机制进行评分:
      • 评分机制:(资源1评分 + 资源2评分 + …… + 资源N评分)/(N*100)*100。
      • 例子:假设某巡检项下涉及3个资源,巡检结果分别为正常、警告、故障/失败,对应的资源评分为100、50、0,则该巡检项的评分为:(100 + 50 + 0)/(3*100)*100=50分。
    • 若巡检项为全局设置类别,该巡检项按照如下机制进行评分:
      • 评分机制:根据该巡检项所涉条目对应的分数,评为该巡检项的健康检查分数。
      • 例子:假设某巡检项下所涉条目,巡检结果为警告,对应的条目评分为50,则该巡检项的评分为50分。
    平台整体评分:根据各个巡检项所得评分按照如下评分机制进行综合统计:
    • 评分机制:(巡检项1评分 + 巡检项2评分 + …… + 巡检项N评分)/(N*100)*100。
    • 例子:假设用户共选择3个巡检项进行一键巡检,对应的评分为100、50、0,则平台总体评分为:(100 + 50 + 0)/(3*100)*100=50分。
  • 巡检建议

    一键巡检针对警告和故障状态的巡检资源和服务,分析其面临的潜在风险以及对相关资源和服务的影响,并提供针对性的修复建议。详细巡检建议信息可参考巡检项总览

  • 巡检报告

    一键巡检支持导出PDF格式的巡检报告,汇总展示巡检所涉平台配置信息、资源状态统计信息以及巡检项结果统计信息。此外,巡检报告汇总所有异常巡检项详情,并为每条异常巡检项提供巡检建议。

功能优势

ZStack Cloud一键巡检具有以下优势:
  • 全方位高效自定义巡检:五大类巡检项涵盖平台上所有关键资源和服务,支持自定义选择巡检,分钟级交付。
  • 多级评分机制:内置资源/服务、巡检项、平台三级评分机制,助力用户从微观至宏观掌控平台运行状态。
  • 智能风险排查建议:智能推送资源级风险分析和应对措施,助力精准高效运维。