🎉 CloudCanal 上线 V6.2.0.0:更低内存占用,更快增量解析
跳到主要内容

配置任务告警

CloudCanal 支持对任务进行告警配置,以便监控任务状态。本文介绍如何进行配置和查看配置信息。

功能入口

进入同步任务列表或任务详情页,点击任务的告警配置入口,打开“任务告警配置”弹窗。

单任务配置会展示该任务当前的完整告警配置,包括告警人员、告警规则和通知设置。批量配置会先展示可配置项入口,只有主动添加的配置项才会在保存时批量覆盖到选中的任务。

告警编辑权限说明

告警配置需要两类权限:告警规则权限和告警人员权限。

账号角色权限会影响页面上可见、可操作的功能。子账号权限是更细粒度的权限划分,决定用户是否能查看/编辑某个资源(数据源/任务等)。

具体可参考 CloudCanal 官方文档:角色权限子账号权限

操作角色权限要求子账号权限要求说明
编辑单任务告警规则或批量修改告警规则
• 数据同步
○ 任务
i. 任务查看
ii. 任务管理
• 任务权限
○ 数据同步
▪ 任务读权限
▪ 任务写权限
用于修改告警规则配置。
编辑告警人员
• 数据同步
○ 任务
i. 任务查看
ii. 任务管理
• 系统设置
○ 子账号管理
i. 子账号管理
ii. 资源授权管理
• 任务权限
○ 数据同步
▪ 任务读权限
▪ 任务写权限
满足权限时,告警人员会展示为可选择的多选框,同时可编辑告警人员;否则只展示当前接收人。
信息

如果一个账号具有 “全部资源” 的权限(系统配置 - 子账号管理 - 全部资源权限),则默认会接收到所有任务的告警。

告警通知配置

告警人员

告警人员决定哪些账号会收到该任务的告警通知。修改告警人员只影响接收权限,不改变告警规则本身。

通知设置

通知设置是任务级公共通知配置,会应用到该任务的告警配置上,优先级最高。

字段说明
暂时关闭告警勾选“关闭”并选择时间段后,在该时间段内暂停发送告警。暂停时间结束后,系统会自动恢复告警。
IM 类型选择任务级 IM 通知渠道。中国站点支持钉钉、企业微信、飞书、自定义。
WebHookIM 通知的 WebHook 地址。勾选 IM 告警方式后,会使用这里配置的任务级 IM 通知信息。
代理地址访问 WebHook 时使用的代理地址,可按环境需要填写。

告警事件和配置项

当前任务告警主要分为 4 类:延迟告警、异常告警、校验差异、事件告警。

告警类型事件标识触发说明常用配置
延迟告警TASK_POSITION_DELAY_EVENT同步任务延迟超过配置阈值时触发;延迟恢复稳定后发送恢复通知。延迟阈值、告警方式、告警抑制间隔、持续时间、是否关联异常。
异常告警TASK_EXCEPTION_EVENT任务运行过程中出现异常事件时触发。告警方式、告警抑制间隔、关键字白名单。
校验差异DATA_TASK_DIFF_EVENT校验任务发现数据不一致或数据丢失时触发。告警方式。
事件告警TASK_NORMAL_EVENT任务触发特定业务事件时触发。事件子类型、告警方式。

延迟告警

延迟告警用于发现同步任务消费位点落后。

配置项说明
指标固定为任务延迟时间,单位分钟。配置值最小为 1 分钟。
告警方式可选择 IM、邮箱、短信、电话。
告警抑制间隔同一延迟告警在指定分钟内只通知一次。默认 5 分钟。同时会受到 cloudcanal console 配置文件中的 console.config.alert.incre.delay.scan.period.sec 扫表频率配置项影响,默认 5 分钟。
持续时间延迟时间达到告警阈值并且持续指定分钟才触发延迟告警;进入延迟态后,在延迟时间小于告警阈值并且持续指定分钟才触发延迟恢复告警。默认 0,表示满足条件后立即触发或恢复。
关联异常后才发送延迟告警开启后,延迟条件满足时还需要在本次延迟周期内关联到任务异常,才发送延迟告警。异常检索范围为:[上一次延迟恢复的时间,当前时间]。

异常告警

异常告警用于通知任务运行过程中的异常。

配置项说明
告警方式可选择 IM、邮箱、短信、电话。
告警抑制间隔同一异常告警在指定分钟内只通知一次。默认 5 分钟。同时会受到 cloudcanal sidecar 配置文件中的 sidecar.config.exp.suppressed.min 配置项影响,默认 5 分钟。该配置项主要用于防止高频相同异常占用 sidecar 与 console 之间的网络资源。
关键字白名单命中白名单关键字的异常不会发送告警,具体值配置为 CloudCanal 发送的告警所携带的异常信息。

校验差异

校验差异告警用于通知校验任务的数据不一致或数据丢失。

配置项说明
告警方式可选择 IM、邮箱、短信、电话。

事件告警

事件告警用于通知任务内的特定业务事件。

配置项说明
事件多选事件子类型。选择多个事件时,任一事件发生都会触发告警。
告警方式可选择 IM、邮箱、短信、电话。
子事件标识说明
源端数据库主备切换事件TASK_DB_SWITCH_EVENT任务检测到源端数据库发生主备切换时触发。
DDL 事件TASK_DDL_EVENT任务检测到源端 DDL 事件时触发。

批量配置

批量配置用于对多个任务应用同一组告警改动。

  1. 在任务列表中选择多个任务。
  2. 打开“批量修改告警配置”。
  3. 按需添加要修改的内容,例如“告警人员”“延迟告警”“异常告警”“校验差异”“事件告警”“通知设置”。
  4. 只填写本次需要统一修改的配置项。
  5. 点击“确认”后,系统会将这些配置应用到所有选中的任务。

批量配置的关键原则是:没有添加的配置项不会修改。比如只添加“异常告警”,则不会改变选中任务的延迟告警、校验差异、事件告警、告警人员和通知设置。

联系我们
微信二维码

扫码添加微信,获取技术支持