可观测性
ZCF 可观测性组件用于汇聚已接入组件的资源、监控和日志数据,帮助用户从全局、组件和资源维度查看运行状态,并进行运维分析和报表输出。
使用可观测性组件前,请先通过 ZCF 云联邦完成基础设施组件接入,并按需启用资源、监控或日志采集。接入和采集完成后,用户可通过首页总览、仪表盘、视图、报表、监控查询、日志查询、资产和基础架构页面查看不同层级的数据。
如果页面中未显示预期数据,请优先检查对应组件是否已接入、采集配置是否启用,以及最近一次采集或同步是否正常。
核心概念
使用可观测性组件前,建议先了解以下与数据来源、分析视图和采集配置相关的概念:
| 概念 | 说明 |
|---|---|
| 数据来源 | 已通过 ZCF 云联邦接入并启用采集的组件或环境。可观测性页面中的资源、监控和日志数据会受接入范围和采集配置影响。 |
| 仪表盘 | 用于集中展示资源健康、容量、性能和资产状态的可视化页面,适合日常巡检和整体状态查看。 |
| 视图 | 可复用的图表或数据展示单元,可用于按特定维度查看资源和监控数据。 |
| 报表模板 | 用于定义报告内容和生成方式的模板,可用于按需或周期性生成运维报告。 |
| 生成记录 | 报表生成后的历史记录,用于查看生成结果,并下载已生成的报表文件。 |
| 监控指标 | 描述资源运行状态的数值型数据,例如 CPU、内存、容量、网络或服务状态等。 |
| 日志 | 来自接入组件的运行、操作或审计类文本记录,用于排查问题、定位异常和追踪操作过程。 |
| 资产 | 同步到 ZCF 的资源对象,例如物理机、云主机、容器资源和存储资源等。 |
| 采集配置 | 用于控制资源、监控和日志数据采集范围的配置。采集配置正常后,相关数据才会进入查询、仪表盘和报表能力。 |
进入可观测性组件
在主菜单右上角切换至全局管理后,可通过以下页面使用 ZCF 可观测性组件。不同页面面向不同运维任务:总览用于快速巡检,仪表盘和报表用于细粒度分析,运维页面用于查询指标、日志和采集状态。
| 页面 | 用途 |
|---|---|
| 首页 | 查看已接入组件的资源规模、健康状态、容量使用和性能情况,适合日常巡检和环境整体状态确认。 |
| 仪表盘与报表 | 查看全局或组件级仪表盘,创建和维护视图、报表模板,并生成周期性或按需报表。 |
| 运维 | 查询监控指标和日志,查看资产与基础架构,并配置资源、监控和日志采集。 |
掌握运行总览
用户可通过首页、仪表盘、资产和基础架构页面查看 ZCF 管理范围内的资源规模、健康状态、容量使用、性能趋势和资源分布。该链路适合日常巡检、环境总览和资源状态确认。
查看全局总览
背景信息
首页用于展示 ZCF 的资源和运维总览,帮助用户在一个页面中了解已接入组件的资源规模、健康状态、容量使用和性能情况。首页适合用于日常巡检、部署后确认和快速判断环境是否存在异常。
| 区域 | 说明 |
|---|---|
| 全局核心态势 | 汇总展示资源总览、健康总览和容量使用率,帮助用户快速了解当前环境整体状态。 |
| 云平台 · 虚拟化与基础资源 | 展示云平台相关资源规模和分布情况,例如云主机、物理机、网络和容量类资源。 |
| 容器 · 编排 | 展示 Kubernetes 集群、节点、工作负载和容器组等容器资源状态,用于了解容器环境运行情况。 |
| 存储 · 分布式 | 展示存储服务器、硬盘等存储资源的状态和健康情况,用于了解存储资源可用性。 |
| 性能洞察 · 资源消耗排行 | 展示资源性能相关排行,帮助用户快速定位需要关注的资源对象。 |
操作步骤
- 登录 ZCF。
- 在主菜单右上角切换至全局管理。
- 在主菜单中单击首页。
- 查看全局核心态势、资源概览、健康概览、容量使用率、资源状态和性能排行等信息。
后续操作
查看仪表盘
背景信息
仪表盘用于从全局或组件维度查看资源健康、容量、性能和资产状态。用户可先查看运维总览,再按资源类型进入云平台、容器或存储仪表盘进行专题巡检。
| 仪表盘 | 适用场景 |
|---|---|
| 运维总览 | 查看已接入组件的整体运行态势,适合日常巡检和跨组件状态确认。 |
| 云平台仪表盘 | 查看云平台资源的概览、可用性、容量、性能和资产清单,适合分析计算、网络和虚拟化资源状态。 |
| 容器仪表盘 | 查看容器资源的概览、可用性、容量、性能、控制面和资产清单,适合分析 Kubernetes 相关资源状态。 |
| 存储仪表盘 | 查看存储资源的概览、可用性、容量、性能和资产清单,适合分析存储容量、健康和性能状态。 |
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 按需选择运维总览、云平台仪表盘、容器仪表盘或存储仪表盘。
- 查看对应仪表盘中的概览、可用性、容量、性能和资产清单等信息。
后续操作
查看资产
背景信息
资产用于跨组件查看和搜索资源,支持按资源类型查看列表,并结合监控数据判断资源运行状态。用户可通过该页面定位具体资源对象,再进一步查看资源详情或关联指标。
| 操作 | 说明 |
|---|---|
| 选择资源类型 | 切换物理机、云主机、容器组等资源类型。 |
| 搜索资源 | 按字段和值搜索资源。 |
| 设置分组 | 按页面支持的分组方式查看资源列表。 |
| 切换展示方式 | 在列表视图、图谱视图和集群热力图之间切换。 |
| 查看资源详情 | 查看资源明细和关联监控信息。 |
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 选择需要查看的资源类型。
- 按字段和值搜索资源,或按页面支持的分组方式查看资源列表。
- 按需在列表视图、图谱视图或集群热力图之间切换。
- 打开资源详情,查看资源明细和关联监控信息。
查看基础架构
背景信息
基础架构用于从全局、云联邦、云平台、存储、容器等视角查看基础资源结构和容量分布。该页面适合用于了解已接入组件的资源组成、容量使用和资源分布情况。
| 查看项 | 说明 |
|---|---|
| 全局概览 | 查看总资产数以及云平台、存储、容器等资源数量。 |
| 容量分布 | 查看不同接入平台的 CPU、内存、存储等容量使用情况。 |
| 网络资源概要 | 查看三层网络、二层网络、IP 地址、安全组、负载均衡等网络资源概况。 |
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 在概览、云联邦、云平台、存储、容器 (K8S)等页签间切换。
- 查看资源数量、容量分布、资源状态或网络资源概要。
构建分析视图与报表
用户可基于内置视图或自定义视图沉淀常用分析维度,并将视图组织为报表模板,按需或周期生成运维报表。该链路适合周期巡检、容量分析、性能回顾和资产清单输出。
查看和维护视图
背景信息
视图用于保存可复用的图表视图,沉淀常用资源或监控分析维度。用户可查看内置视图,也可维护已有自定义视图,用于后续巡检、报表输出或问题分析。
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 在概览页签查看内置视图,或在管理页签维护自定义视图。
操作 说明 查看内置视图 在概览页签查看可用性、资产、性能、容量等常用分析视图。 切换平台类型 按云平台、容器、存储等平台类型切换视图展示范围。 搜索或筛选视图 按视图名称或适用平台类型查找视图。 克隆或维护视图 克隆内置视图,或编辑、克隆、删除自定义视图。
后续操作
创建自定义视图
背景信息
当内置视图不能满足特定资源或指标分析需求时,可创建自定义视图。自定义视图创建后,可在视图列表中复用,也可作为报表模板的内容来源。
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 在管理页签中,单击新建视图。
- 按页面提示配置自定义视图参数。
配置项 说明 名称 自定义视图在视图列表和报表模板中的显示名称。建议使用能够体现分析对象或用途的名称。 描述 视图用途说明,便于后续识别该视图适用的巡检、分析或报表场景。 视图类型 选择视图的展示和分析类型。不同视图类型对应的配置项可能不同,请以页面展示为准。 业务分类 选择视图所属分类,便于在视图列表、报表模板和后续维护中筛选。 适用平台类型 选择视图适用的平台范围,例如云平台、容器或存储等类型。视图可用数据取决于已接入组件和采集状态。 资源类型 选择需要分析的资源对象类型。不同资源类型支持的字段、指标和过滤条件可能不同。 视图配置 按页面提示配置展示字段、指标、过滤条件或图表展示方式,用于定义视图的具体展示内容。 - 在预览确认中确认展示效果,并保存视图。
后续操作
查看和维护报表模板
背景信息
报表模板用于定义报告内容和生成方式。用户可查看内置的容量、性能、资产清单和可用性模板,也可基于已有模板克隆出新的报表模板。
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 在报表模板页签中查看、搜索或克隆报表模板。
操作 说明 查看模板 查看容量、性能、资产清单、可用性等报表模板,确认模板适用范围和报告内容。 克隆模板 基于已有模板复制生成新的报表模板,适合在内置模板基础上调整报告内容。 搜索模板 按报表模板名称搜索已有模板。
创建报表模板
背景信息
报表模板用于组合多个视图,形成可按需或周期生成的运维报告。用户可基于已有视图创建报表模板,用于容量分析、性能回顾、资产清单或可用性检查等场景。
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 在报表模板页签中,单击新建报表模板。
- 按页面提示配置报表模板参数。
配置项 说明 模板名称 报表模板在模板列表和生成记录中的显示名称。建议使用能够体现报表用途的名称。 描述 报表模板用途说明,便于区分容量分析、性能回顾、资产清单或可用性检查等不同模板。 可用视图 选择需要加入报表的视图。可用视图包括内置视图和已创建的自定义视图。 视图分类 按分类筛选可用视图,便于从容量、性能、资产、可用性等分析维度中选择报表内容。 报表内容 确认已添加的视图及展示顺序,决定报表生成后的主要内容结构。 - 在报表内容区域确认视图顺序和内容后,按页面提示保存模板。
后续操作
生成和下载报表
背景信息
报表可基于报表模板按需立即生成,也可按计划周期生成。用户可在生成记录页签查看生成历史,并下载已生成的报表文件。
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 在报表模板页签中选择需要使用的模板。
- 按需立即生成报表,或为模板配置定时生成规则。
操作 说明 立即生成 基于报表模板立即生成报告,适合临时输出巡检或分析结果。 配置定时生成 为报表模板配置周期性生成规则,适合固定周期输出容量、性能、资产清单或可用性报告。 查看生成记录 查看报表生成历史、执行状态和生成结果。 下载报表 下载已生成的报表文件。可用格式以页面展示为准。 - 在生成记录页签查看生成结果,并下载报表文件。
排查监控与日志问题
用户可先通过监控摘要和日志摘要了解数据规模、来源分布和趋势,再进入监控查询或日志查询页面按指标、字段、级别和时间范围定位问题。该链路适合性能波动分析、异常日志排查和实时日志诊断。
查看监控摘要
背景信息
监控摘要用于查看当前监控数据接入情况。用户可通过该页面确认哪些组件已有监控数据、数据规模是否符合预期,以及是否存在采集异常。
| 查看项 | 说明 |
|---|---|
| 采集概况 | 查看接入平台数量、在线状态、指标数量和监控数据总量,确认监控数据是否已进入 ZCF。 |
| 来源分布 | 查看不同接入平台的指标数量和数据占比,判断各平台数据规模是否符合预期。 |
| 集成平台 | 查看已接入监控的平台列表及其数据规模,用于定位缺少监控数据的平台。 |
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 查看监控数据接入概况、来源分布和集成平台列表。
查询监控数据
背景信息
监控查询用于组合平台、资源和指标条件,查看一个或多个指标在指定时间范围内的趋势。常用查询可保存为视图,便于后续复用分析。
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 按页面提示设置监控查询条件。
配置项 说明 查询对象 选择需要分析的平台、资源范围或资源对象。 指标和时间范围 选择指标、统计方式、图表样式和时间范围,查看对应监控趋势。 多个指标 在同一查询中添加多个指标,辅助分析不同指标之间的变化关系。 - 执行查询,查看监控趋势;如需对比多个指标,可继续添加指标后重新查询。
后续操作
保存监控查询为视图
背景信息
对需要反复查看的监控查询,可将查询条件和展示方式保存为视图。保存后的视图可在视图列表中复用,也可加入报表模板。
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 按页面提示设置监控查询条件。
配置项 说明 平台 选择需要查询监控数据的平台或组件范围。可选范围取决于已接入组件和监控采集状态。 资源范围 选择需要分析的资源对象或资源分组,用于限定监控查询的数据范围。 指标 选择需要查看的一个或多个监控指标。不同平台和资源类型支持的指标可能不同。 统计方式 选择指标数据的聚合或统计方式,用于控制趋势图中的数据计算口径。 图表样式 选择查询结果的展示方式,便于按趋势、对比或分布等方式查看指标数据。 时间范围 选择监控数据查询的时间范围。保存为视图后,后续可基于该查询条件复用分析。 - 执行查询,并确认查询结果符合预期。
- 按页面提示将当前查询保存为视图。
- 进入,确认已生成对应视图。
查看日志摘要
背景信息
日志摘要用于查看日志总量、日志条目、数据源排行、日志量趋势和日志级别分布。用户可通过该页面判断日志采集是否正常,以及哪些平台或日志级别更需要关注。
| 查看项 | 说明 |
|---|---|
| 时间范围 | 按最近 15 分钟、1 小时、24 小时、7 天等范围查看日志数据。 |
| 日志概况 | 查看总数据量、日志条目、摄入速率和活跃数据源,确认日志是否持续进入 ZCF。 |
| 来源与级别分布 | 查看不同接入平台的日志量排行和日志级别分布,定位日志量异常或告警级别较高的平台。 |
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 切换时间范围,查看日志概况、来源排行、日志量趋势和日志级别分布。
查询日志
背景信息
日志查询用于按平台、字段、级别和时间范围检索日志。用户可通过字段过滤缩小查询范围,定位异常时间段、日志来源和关键字段。
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 按页面提示设置日志查询条件。
配置项 说明 查询范围 选择接入平台和时间范围,确定需要检索的日志数据范围。 过滤条件 根据日志解析出的字段、日志级别等条件过滤结果,缩小排查范围。 - 查看日志分布和日志明细。
后续操作
使用实时流诊断日志
背景信息
当需要观察当前持续输出的日志时,可使用实时流进行诊断。实时流适合在复现问题、执行运维操作或验证日志采集状态时查看最新日志。
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 切换至实时流页签。
- 选择需要查看日志的接入平台,并按需设置日志来源或过滤条件。
- 查看实时输出的日志内容,结合时间、级别和关键字段定位异常。
后续操作
配置数据采集
资源、监控和日志数据是可观测分析的基础。用户可通过对应采集页面确认采集状态、同步结果和采集配置,并在数据缺失或采集范围变化时调整对应采集策略。
配置资源采集
背景信息
资源采集用于确认各平台资源数据的同步状态,并调整资源同步策略。资源采集正常后,资产、基础架构、仪表盘和报表页面才能展示对应资源数据。
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 在平台列表中选择需要查看的接入平台,并查看资源采集状态。
操作 说明 查看同步状态 查看接入平台的资源总数、同步状态、最近同步时间和同步频率。 查看资源类型结果 按资源类型查看同步结果,判断指定类型的资源数据是否已正常采集。 - 如需立即更新资源数据,且页面提供立即同步操作,可在目标平台上手动触发资源同步。
- 如需调整采集范围或同步策略,按页面提示更新资源采集配置。
操作 说明 手动同步资源 在页面提供立即同步操作时,手动触发资源同步。 调整采集范围 根据运维分析需要,调整需要采集的资源范围或同步策略。
后续操作
配置监控采集
背景信息
监控采集管理用于确认各平台监控指标的采集状态,并调整指标采集配置。监控采集正常后,监控摘要、监控查询、仪表盘和报表页面才能展示对应指标数据。
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 查看平台类型、采集状态、更新时间和相关采集配置。
操作 说明 查看采集状态 查看平台类型、采集状态、更新时间和指标采集配置。 排查缺失指标 当仪表盘、监控查询或报表缺少指标数据时,优先确认采集状态和接入平台连接状态。 - 如需调整监控采集范围或采集策略,进入对应采集配置并按页面提示修改。
操作 说明 调整采集配置 根据需要调整监控采集范围或采集策略。
后续操作
配置日志采集
背景信息
日志采集管理用于确认各平台日志数据的采集状态,并调整日志采集配置。日志采集正常后,日志摘要和日志查询页面才能展示对应日志数据。
操作步骤
- 在主菜单右上角切换至全局管理。
- 进入。
- 查看平台类型、采集状态、采集目标、更新时间和相关采集配置。
操作 说明 查看采集状态 查看平台类型、采集状态、采集目标、更新时间和日志采集配置。 排查缺失日志 当日志摘要或日志查询缺少数据时,优先确认采集状态和接入平台连接状态。 - 如需调整日志采集范围或采集策略,进入对应采集配置并按页面提示修改。
操作 说明 调整采集配置 根据需要调整日志采集范围、采集目标或采集策略。
