本章节主要介绍在告警订阅页面中,用户可以创建各种类型的告警订阅,通过不同的渠道推送告警消息,便于用户实时了解所关注的系统运行情况。在云平台的顶部导航栏中,依次选择[产品与服务]-[可观测性]-[告警管理]后,在左侧导航栏中选择[告警订阅],即可访问“告警订阅”页面。
查看订阅
订阅列表
进入[告警订阅]页面后,即可查看所有告警订阅的基本信息。
其中部门/项目信息只在云管理员权限才会展示。
可以点击左上角 刷新
按钮以获取最新告警订阅列表信息,也可以点击右上角 搜索框
以筛选指定告警订阅信息,点击 导出
以导出当前列表信息,点击 设置
以自定义显示页面信息内容。
订阅详情
在点击告警订阅的名称后,可以进入告警订阅的详情页面,页面分为以下几种类型:
创建订阅
点击右上角的 创建
按钮可创建新的告警订阅。
告警订阅支持两种创建方式:
- 全新创建,代表可以从零创建告警订阅的内容;
- 模板创建,代表可以从已经存在的告警订阅中选择某一个告警订阅以填充基本信息的内容。
告警订阅支持多种通知渠道,比如邮件、企业微信、钉钉、飞书和 Webhook。
邮件类型
以上表单可填字段解释如下:
- 订阅名称:自定义订阅名称;
- 描述:可为该订阅添加描述信息;
- 订阅类型:选择邮件类型;
- 订阅语言:可选中文和 English;
- SMTP服务器地址:填写服务器地址;
- SMTP服务器端口:填写端口,支持使用TLS安全连接;
- 认证方式:认证方式支持身份认证和无身份认证,在选择身份认证后,需要填写用户名和密码;
- 发件人邮箱:填写发件人邮箱;
- 发送恢复通知:当告警消息恢复时,是否发送恢复通知;
- 收件人邮箱(订阅终端):支持填写多个订阅终端。
点击右下角 测试
按钮,可以测试订阅终端是否可以正常收到通知。
企业微信类型
以上表单可填字段解释如下:
- 订阅名称:自定义订阅名称;
- 描述:可为该订阅添加描述信息;
- 订阅类型:选择企业微信类型;
- 订阅语言:可选中文和 English;
- 群机器人(订阅终端):支持添加多个群机器人
- 机器人地址: 企业微信中创建的群机器人地址;
- 最大消息长度:控制可以接收的告警消息长度,超出长度的内容将被截断;
- 发送恢复通知:当告警消息恢复时,是否发送恢复通知。
点击右下角 测试
按钮,可以测试订阅终端是否可以正常收到通知。
钉钉类型
以上表单可填字段解释如下:
- 订阅名称:自定义订阅名称;
- 描述:可为该订阅添加描述信息;
- 订阅类型:选择钉钉类型;
- 订阅语言:可选中文和 English;
- 群机器人(订阅终端):支持添加多个群机器人
- 机器人地址: 钉钉中创建的群机器人地址;
- 安全密钥:钉钉中创建的群机器人-加签,签名不一致将无法接收消息;
- 安全关键词:钉钉中创建的群机器人-自定义关键词,多个关键词为或关系;
- 最大消息长度:控制可以接收的告警消息长度,超出长度的内容将被截断;
- 发送恢复通知:当告警消息恢复时,是否发送恢复通知。
如果钉钉中创建的群机器人设置了加签属性,告警订阅中设置的安全密钥需要与其保持一致,否则将无法接收告警消息;
如果钉钉中创建的群机器人设置了自定义关键词,告警订阅中至少需要包含一个关键词才可以发送成功,否则将无法接收告警消息。
点击右下角 测试
按钮,可以测试订阅终端是否可以正常收到通知。
飞书类型
以上表单可填字段解释如下:
- 订阅名称:自定义订阅名称;
- 描述:可为该订阅添加描述信息;
- 订阅类型:选择飞书类型;
- 订阅语言:可选中文和 English;
- 群机器人(订阅终端):支持添加多个群机器人
- 机器人地址: 飞书中创建的群机器人地址;
- 安全密钥:飞书中创建的群机器人-签名校验,签名不一致将无法接收消息;
- 安全关键词:飞书中创建的群机器人-自定义关键词,多个关键词为或关系;
- 最大消息长度:控制可以接收的告警消息长度,超出长度的内容将被截断;
- 发送恢复通知:当告警消息恢复时,是否发送恢复通知。
如果飞书中创建的群机器人设置了签名校验属性,告警订阅中设置的安全密钥需要与其保持一致,否则将无法接收告警消息;
如果飞书中创建的群机器人设置了自定义关键词,告警订阅中至少需要包含一个关键词才可以发送成功,否则将无法接收告警消息。
点击右下角 测试
按钮,可以测试订阅终端是否可以正常收到通知。
Webhook类型
以上表单可填字段解释如下:
- 订阅名称:自定义订阅名称;
- 描述:可为该订阅添加描述信息;
- 订阅类型:选择 Webhook 类型;
- Webhook(订阅终端):支持添加多个 Webhook 地址
- Webhook 地址:填写 Webhook 地址;
- 认证方式:支持无认证、基础认证和Bearer令牌;
- 跳过TLS安全验证:支持选择是否跳过TLS安全验证;
- 发送恢复通知:当告警消息恢复时,是否发送恢复通知。
点击右下角 测试
按钮,可以测试订阅终端是否可以正常收到通知。
- 认证方式如果选择基础认证和Bearer令牌认证,Webhook 将会把认证信息放进 HTTP Header 中的 Authorization 字段发送给订阅终端地址;
- Webhook 将会以 json 格式发送 POST 请求到指定的订阅终端地址,详细格式参见 最佳实践-告警消息对接-webhook消息推送格式。
编辑订阅
告警订阅支持编辑操作,点击告警订阅列表页面的操作列的 编辑
按钮,或者在进入告警订阅详情页面之后,点击右上角的 更多操作
- 编辑
按钮,对该告警订阅进行编辑操作。
可编辑字段与创建订阅基本一致,区别在于订阅类型无法修改。
启用订阅
告警订阅支持启用操作,在告警订阅创建后,默认为启用状态,此时该订阅可以接收通知。点击告警订阅列表页面的操作列的 启用
按钮,或者在进入告警订阅详情页面之后,点击右上角的 更多操作
- 启用
按钮,可启用该告警订阅。
已启用的告警订阅不支持再次启用。
禁用订阅
告警订阅支持禁用操作,禁用后的告警订阅,将不再接收通知。点击告警订阅列表页面的操作列的 禁用
按钮,或者在进入告警订阅详情页面之后,点击右上角的 更多操作
- 禁用
按钮,可禁用该告警订阅。
已禁用的告警订阅不支持再次禁用。
删除订阅
告警订阅支持删除操作,点击告警订阅列表页面的操作列的 删除
按钮,或者在进入告警订阅详情页面之后,点击右上角的 更多操作
- 删除
按钮,可对该告警订阅进行删除操作,删除告警订阅后,已关联的告警分组将自动解除关联。
已关联告警分组
在告警订阅详情页下,点击 已关联告警分组
可以查看与该告警订阅已经关联的告警分组。
关联分组
在已关联告警分组页面下,点击左上角的 关联分组
来关联一个或多个告警分组。点击关联分组后,填写弹窗中的配置信息:
分组名称:点击分组名称的下拉框可以选择当前项目下的告警分组,可多选/全选;
订阅策略:
分组等待:告警名称相同的消息会被聚合在一起发送出去,这是最初聚合消息被发送之前的等待时间,通常为0s到几分钟。等待时间越短,告警消息发送就越及时,同时也可能需要分更多次才能发送完所有的告警消息;反之将聚合到更多的初始告警消息,一次发送出去。默认值:30s,取值范围:0s~5m,一般使用默认值即可;
分组间隔:告警名称相同的消息会被聚合在一起发送出去,这是发送完初始聚合消息之后、发送新的告警消息之前的等待时间,通常为5m或更多,这些新消息会被添加到已经聚合的告警消息中。间隔时间越短,新的告警消息发送就越及时,同时也可能需要分更多次才能发送完所有的告警消息;反之将聚合到更多新的告警消息,一次发送出去。默认值:5m,取值范围:15s~15m,一般使用默认值即可;
重复间隔:告警消息发送成功后,再次发送消息的等待时间,通常为3h或更多,如果在此之前告警已经恢复,则不会重复发送。默认值:3h,取值范围:1m~24h。
告警订阅可能会有偶尔重复发送告警通知的现象,且当分组间隔时间设置小于等于1min时,偶现概率会变大,因此建议分组间隔时间设置大于1min,与默认值相近。
用户还可以通过添加子策略的形式,更深层次的定制订阅策略的内容,在子策略中可以通过标签匹配的方式更细粒度的控制告警消息发送通知的策略,标签匹配的内容分为内置和自定义:
内置
- 标签键:告警级别
- 操作符:=(等于)、!=(不等于)
- 标签值:严重、警告、信息
自定义
- 标签键:需要自定义标签键名称
- 操作符:=(等于)、!=(不等于)、=~ (正则匹配)、!~ (正则不匹配)
- 标签值:选择自定义键时,用户需要自定义输入标签值
最多支持2层子策略嵌套,每层最多设置10条子策略。
请注意子策略中的订阅策略优先级大于上级订阅策略,子策略中配置的策略时间会覆盖上级策略配置的策略时间。
解除订阅
在已关联告警分组页面下,点击左上角的 解除订阅
来解除选中的告警订阅,或者点击 已关联告警分组
页面每个告警分组右边的 解除订阅
按钮。