跳转至

内存泄漏


概述

「内存泄漏」基于内存异常分析检测器,定期对主机进行智能巡检,通过出现内存异常的主机来进行根因分析,确定对应异常时间点的进程和 pod 信息,分析当前工作空间主机是否存在内存泄漏问题。

启用/禁用

智能巡检「内存泄漏」默认是「禁用」状态,可手动「启用」,开启后,将对当前工作空间的所有主机进行巡检,支持添加主机筛选条件。

导出

智能巡检支持“导出 JSON 配置”。在智能巡检列表右侧的操作菜单下,点击「导出」按钮,即可导出当前巡检的 JSON 代码,导出文件名格式:智能巡检名称.json 。

编辑

智能巡检「内存泄漏」支持用户手动添加筛选条件及告警通知策略,在智能巡检列表右侧的操作菜单下,点击「编辑」按钮,即可对巡检模版进行编辑。

  • 检测对象:默认为「主机」
  • 数据范围:6 小时;检测频率:1 小时
  • 筛选条件:支持手动配置keyvalue 的筛选条件,支持多种筛选方式:
  • 并且 :支持根据需求进行多条件筛选
  • >>=<<==!=matchnot matchwildcardnot wildcard:同时支持数值和字符串类型的字段筛选

  • 告警通知:支持选择和编辑告警策略,包括需要通知的事件等级、通知对象、以及告警沉默周期等

注意:若配置了筛选条件,在未恢复事件/事件详情页的「基础属性」下「检测维度」区域处显示对应的筛选条件。

查看相关事件

智能巡检基于观测云智能算法,会查找内存指标中的异常情况,如内存使用率突然飙升。对于异常情况,智能巡检会生成相应的事件,在智能巡检列表右侧的操作菜单下,点击「查看相关事件」按钮,即可查看对应异常事件。

事件详情页

点击「事件」,可查看智能巡检事件的详情页,包括事件状态、异常发生的时间、异常名称、基础属性、根因分析、告警通知、历史记录和关联事件。

  • 点击详情页右上角的「查看监控器配置」小图标,支持查看和编辑当前智能巡检的配置详情
  • 点击详情页右上角的「导出事件 JSON」小图标,支持导出事件的详情内容

基础属性

  • 检测维度:基于智能巡检配置的筛选条件,支持将检测维度 key/value 复制、添加到筛选、以及查看相关日志、容器、进程、安全巡检、链路、用户访问监测、可用性监测以及 CI 等数据
  • 扩展属性:选择扩展属性后支持以 key/value 的形式复制、正向/反向筛选

事件详情

  • 事件概览:描述异常巡检事件的对象、内容等
  • 异常详情:智能检测的内存占用指标异常图表趋势
  • 图表关联:点击图表数据可复制名称、标签,以及查看相关主机、容器、进程、日志、链路、Profile、用户访问、安全巡检、可用性监测、CI等数据
  • 图表单位:图表数据的默认显示单位,根据该单位的进位规则做自动进位显示
  • 基线:智能巡检数据中的异常基准线
  • 异常区间:智能巡检数据中的异常开始时间到结束时间
  • 根因分析区间:智能巡检过程中算法实际查询根因的数据时间范围
  • 图例显示:若当前超过两个图例,鼠标放在图例上,着重显示图例对应的图表数据;鼠标点击选中单个图例,仅显示该图例对应的图表数据
  • 预测虚线:表示提前预测的趋势线
  • 异常分析:智能检测的异常内存占用 Top 10 的进程和 Pod 列表,帮助用户快速定位内存异常的原因;点击主机,支持复制和查看相关日志、容器、进程、安全巡检、链路、用户访问监测、可用性监测以及 CI 等

告警通知

显示通知对象类型、通知对象名称、告警策略、以及通知是否发送成功等信息。

历史记录

支持查看检测对象主机、异常/恢复时间和持续时长

关联事件

支持通过筛选字段和所选取的时间组件信息,查看关联事件

内置视图

支持手动添加 tags 关联的内置视图结合智能巡检进行分析。关于如何配置内置视图可参考文档 绑定内置视图

常见问题

1.智能巡检内存泄漏的检测频率

内存泄漏智能巡检开启后,观测云会按照每 1 小时 1 次的检测频率,巡检过去 6 小时时间范围内主机内存否出现异常,通过根因分析获取出现的异常的进程或者 Pod 。

2.智能巡检内存泄漏相关的指标集

基于主机对象(hostobject) 和 内存指标(mem)

3.在何种情况下会产生内存泄漏智能巡检事件

通过观测云的智能算法,跟踪 used_percent 指标趋势,当指标快速升高、或将要逼近临界值、或触发临界值时会触发巡检事件。