自定义代码任务
本文简要介绍了 CloudCanal 自定义代码操作步骤,涵盖代码开发、任务创建和更新、问题排查等。
简述
自定义代码允许用户使用 java 代码编写自定义数据处理逻辑,通过将代码 jar 包上传 CloudCanal ,在数据全量迁移、增量同步、数据校验订正时自动调用这些代码,达到各种数据转换处理目的。
自定义代码调用位于 CloudCanal 整个任务处理链的中间部分,如下图所示:

应用场景
自定义代码主要应用于 CloudCanal 暂时无法标准化的数据迁移同步场景,具有灵活、带有一定业务语意、以及部分复杂度的特点。
以下罗列部分场景以供参考:
- 数据变换
- 数据脱敏,可附带业务加解密算法
- 时间数据时区转换
- 数据清洗
- 异常值和空值处理
- 缺失值补全
- 数据标准化
- 实时宽表构建
- 事实表维表打宽表
- 数据汇聚
- 分库分表数据汇聚
- 跨区域数据集中