任务高级配置
自动创建库表列
CloudCanal支持自动创建库表列。选中源端后如果对端没有对应映射规则的库表列,页面会出现 待创建 的黄色字样,代表任务创建后,CloudCanal为自动 为该任务生成一个结构迁移任务,并自动创建 待创建 的库表列。
目前仅支持自动创建对应映射规则的库表列名称,暂不支持自定义名称。
映射规则
创建任务过程中,CloudCanal会根据对应的映射规则自动匹配对端的库表列。不同的链路有不同的映射规则,大多数为默认同名映射。如存在多个映射规则,则支持手动选择规则,CloudCanal 会自动根据规则匹配对应的库表列名称。
如该映射规则不符合你的需求,可以手动选择对端的库表列进行映射。
全库同步
CloudCanal支持 白名单同步 模式和 全库同步 模式,默认为 白名单同步 模式。
白名单同步 指只同步在创建任务时选择的表,如同步过程中有新增表则不同步。
全库同步 指完全同步全库,新增表也会同步。
- 选中源端的 高级配置
- 选择 全库同步
- 选择要同步的库
- 点击下一步,配置任务
- 点击 创建任务, 任务创建完成
树形模式
数据库映射支持普通模式和树形模式两种。树形模式用于需要选择很多库的场景,方便选库。但树形模式与全库同步没有关系,如需全库同步请看 全库同步 。
数据校验
CloudCanal目前支持定时对数据进行全量的校验。可以创建单独的数据校验任务,也可以在功能配置页面 是否开启校验 选项处进行配置。
创建成功后,页面上会出现数据校验任务。如果是一次性的,会立即开始校验。如果是定时的,则会在特定时间进行校验并自动等待下一次。
校验完成后,会出现校验的统计信息。如需查看详细的校验结果,可以去 任务详情 - 查看日志 进行查看。
数据订正
CloudCanal目前支持定时对数据进行全量的订正。创建任务时类型选择 数据订正 即可创建数据订正任务。
创建成功后,页面上会出现数据订正任务,并开始执行。
ddl同步
支持ddl同步的链路,默认在创建任务第二步会选中同步,在增量同步阶段,若源端发生结构变更,该变更将会同步到对端。
如在任务进行中需调整ddl同步的策略,参见参数修改
action过滤
CloudCanal支持对数据进行action过滤,主要应用于增量同步阶段。部分链路目前除了支持dml的action过滤,还支持ddl的action过滤。 默认选中所有的action,可以根据需求勾掉一些action操作。支持表级别和库级别的配置。
数据筛选
CloudCanal支持设置where条件来进行数据筛选。
- 在数据处理步骤,选择需要添加虚拟列的表,点击 操作, 点击 where条件
- 写入正确的where条件
- 点击 确认,添加成功
批量设置where条件
- 如需批量操作,点击 批量操作 - 批量添加where条件
- 写入正确的where条件,并点击 查找有以上列的表,勾选需要设置的表
- 点击 确认,修改成功
设置目标主键
CloudCanal默认源端主键与目标端主键一致,如果目标端的主键与源端不一致,可以手动设置目标主键。另外,如果是无主键表,系统会默认将目标端的唯一索引设置为目标主键。
- 在数据处理步骤,选择需要修改的表,确认当前的主键是否是正确的目标端主键,主键右侧会有一个🔑的标记
- 点击 操作 - 修改目标主键
- 选择需要修改为目标主键的列
- 点击 确认,修改成功,设置完的目标主键列右侧出现🔑的标记。
批量设置目标主键
- 如需批量操作,点击 批量操作 - 批量设置目标主键
- 选择需要设置的列,并查找有该列的表,勾选需要设置的表
- 点击 确认,修改成功,设置完的所有勾选的表的目标主键列右侧出现🔑的标记。
虚拟列
创建任务时,如果想在创建一列或多列有固定值且源端不存在的列,除了使用自定义代码外,也可以在页面上直接使用 虚拟列 的功能。
- 在数据处理步骤,选择需要添加虚拟列的表,点击 操作, 点击 虚拟列
- 输入需要添加的虚拟列,如果是目标端已经存在的列,则会自动填充相关信息。如果是新增列,则需要填写完整的列信息
- 填写该列的值
- 点击 确定, 添加成功。页面出现虚拟列信息
创建相似任务
当感觉手动创建一个相同或相似的任务过于繁琐时,可以在任务详情页点击 功能列表 - 创建相似任务 ,系统将会读取该任务的配置,直接在新疆任务过程中 进行赋值,免去了重复选择、分时费力的操作。也可以基于原任务的配置进行适当修改。
重启历史记录
如想查看任务重启过的历史,可在任务详情页点击 功能列表 - 重启任务历史 。
回溯位点
在增量同步阶段,如需重新同步前一段时间的数据,可以进行回溯位点。如不想跳过某段时间的数据,可以先 重置位点,将位点设置为当前时间, 再进行位点回溯。
- 任务处于增量同步阶段时,停止任务
- 点击 回溯位点
- 选择 位点类型,并填写相关的位点信息
- 点击 确定 , 位点已成功回溯
- 启动任务,任务将按设置完的位点进行同步
大小写不敏感
目前仅支持目标端为PostgreSQL或Greenplum时,支持手动指定对端大小写是否敏感。默认选中大小写不敏感,当选择大小写不敏感时,对端库、表、列会自动映射成全小写。 其余链路会根据系统获取的参数,自动分辨映射是否需要转小写。