一键巡检:对云平台关键资源和服务进行全方位一键式健康检查,并根据巡检结果为巡检资源和服务进行健康评分,同时提供巡检建议和巡检报告,助力高效运维,确保云平台资源和服务处于最佳状态。一键巡检适用于需要对平台进行集中高效运维场景。
如图1所示:

图1 一键巡检

功能原理
- 巡检类别和巡检项:一键巡检提供平台、计算、网络、存储、全局设置五大类别巡检项,支持对管理节点、物理机和云主机、镜像服务器和主存储、物理/虚拟网络和网卡、许可证等平台关键资源和服务进行巡检:
- 平台:检测平台基础服务和运行状态。
- 计算:检测平台物理计算资源和虚拟化计算资源使用状况和运行状态。
- 网络:检测平台物理网络和虚拟化网络配置和状态。
- 存储:检测平台物理存储资源使用状况和运行状态。
- 全局设置:检测平台全局性重要资源的配置情况。
用户可自定义根据类别选择巡检项进行一键巡检,启动巡检后,平台将对所选择的巡检项涉及的资源或服务进行健康检查。详细巡检项信息可参考巡检项总览。
- 巡检结果:一键巡检针对所巡检的资源或服务提供四种巡检结果,分别为正常、警告、故障和失败。
- 正常:所巡检的资源或服务处于正常状态,通过绿色图标标识。
- 警告:所巡检的资源或服务状态欠佳,可能会在一定程度上影响相关资源和服务的性能和稳定性,通过黄色图标标识。
- 故障:所巡检的资源或服务状态非常危险,可能会严重影响业务的运行,通过红色图标标识。
- 失败:资源或服务巡检失败,可能会严重影响业务的运行,通过灰色图标标识。
- 健康评分:
一键巡检内置健康评分机制,支持对所巡检的资源或服务的健康状态进行量化评分,帮助用户直观准确把握平台整体运行状态。
巡检资源/服务评分:根据资源或服务的巡检结果进行评分。- 若某资源/服务所有巡检属性均正常,该资源/服务的巡检结果为正常,评分为100分。
- 若某资源/服务存在一个巡检属性处于警告状态,其他巡检属性均正常,该资源/服务的巡检结果为警告,评分为50分。
- 若某资源/服务存在一个巡检属性处于故障或失败状态,该资源/服务的巡检结果为故障或失败,评分为0分。
巡检项评分:根据巡检项所涉及资源或服务的评分进行统计。-
若巡检项非全局设置类别,该巡检项按照如下机制进行评分:
- 评分机制:(资源1评分 + 资源2评分 + …… + 资源N评分)/(N*100)*100。
- 例子:假设某巡检项下涉及3个资源,巡检结果分别为正常、警告、故障/失败,对应的资源评分为100、50、0,则该巡检项的评分为:(100 + 50 + 0)/(3*100)*100=50分。
-
若巡检项为全局设置类别,该巡检项按照如下机制进行评分:
- 评分机制:根据该巡检项所涉条目对应的分数,评为该巡检项的健康检查分数。
- 例子:假设某巡检项下所涉条目,巡检结果为警告,对应的条目评分为50,则该巡检项的评分为50分。
平台整体评分:根据各个巡检项所得评分按照如下评分机制进行综合统计:- 评分机制:(巡检项1评分 + 巡检项2评分 + …… + 巡检项N评分)/(N*100)*100。
- 例子:假设用户共选择3个巡检项进行一键巡检,对应的评分为100、50、0,则平台总体评分为:(100 + 50 + 0)/(3*100)*100=50分。
- 巡检建议:
一键巡检针对警告和故障状态的巡检资源和服务,分析其面临的潜在风险以及对相关资源和服务的影响,并提供针对性的修复建议。详细巡检建议信息可参考巡检项总览。
- 巡检报告:
一键巡检支持导出PDF格式的巡检报告,汇总展示巡检所涉平台配置信息、资源状态统计信息以及巡检项结果统计信息。此外,巡检报告汇总所有异常巡检项详情,并为每条异常巡检项提供巡检建议。
功能优势
ZStack Cloud一键巡检具有以下优势:
- 全方位高效自定义巡检:五大类巡检项涵盖平台上所有关键资源和服务,支持自定义选择巡检,分钟级交付。
- 多级评分机制:内置资源/服务、巡检项、平台三级评分机制,助力用户从微观至宏观掌控平台运行状态。
- 智能风险排查建议:智能推送资源级风险分析和应对措施,助力精准高效运维。