Dameng 到 StarRocks
CloudCanal 支持从 Dameng 到 StarRocks 的数据迁移、同步、校验和链路能力。
| 功能 | 说明 |
|---|---|
结构迁移 | 如目标不存在所选表,则自动根据源端元数据,结合映射生成对端创建语句并执行创建 |
全量数据迁移 | 逻辑迁移,通过顺序扫描表数据,将数据分批写入到对端数据库 |
增量实时同步 | 支持 INSERT, UPDATE, DELETE 常见 DML 同步 |
数据校验和订正 | 全量数据校验,并可选根据校验结果订正差异数据,支持定时,文档:创建定时校验订正任务 |
修改订阅 | 新增、删除、修改订阅表,支持历史数据迁移,文档:修改订阅 |
重置位点 | 支持按照文件位点、时间戳 回溯位点,重新消费过去一段时间或指定 Binlog 文件和位点开始的增量日志 |
表名映射 | 支持 和源端保持一致, 转小写, 转大写, 以'_数字'后缀截取 |
DDL 同步 |
|
元数据检索 | 从源端表查对端,查询设置过过滤条件的,查询设置过对端主键的 |
高级 功能
| 功能 | 说明 |
|---|---|
全量前清空目标数据 | 运行全量任务前清除老数据,包括重跑任务、定时全量迁移都会触发此能力 |
重建目标表 | 运行全量任务前重建目标表,包括重跑任务、定时全量迁移都会触发此能力 |
Stream Load 数据写入 | 采用 Stream Load 到 StarRocks Be 写入数据, 默认攒批写入,可动态调节刷出数据节奏和批次大小 |
0 值时间处理 | 支持将 0 值时间设置成不同类型的值,防止写入对端报错 |
自定义表属性 | 包括分桶数、副本数等属性设置 |
设置数据分区 | 创建任务时,可按表粒度指定分区定义(静态或动态),结构迁移时自动添加该分区定义 |
定时全量迁移 | 文档1:创建定时全量任务 |
自定义代码 | 文档1:创建自定义代码任务 |
设置目标主键 | 变更主键为其他字段,方便数据聚合等操作 |
数据过滤条件 | 支持 WHERE 条件进行数据过滤,内容为 SQL 92 子集,文档:创建数据过滤任务 |
限制和注意点
| 限制项 | 说明 |
|---|---|
数据类型 | 不支持 BLOB 及衍生类型 |
对端表类型 | 仅支持 主键模型(Primary Key) |
源端表类型 | 不支持 无主键表 迁移同步 |
DDL 同步报错 |
|
增量写入冲突策略 | Stream Load 写入以主键进行整 行替换 |
前置条件
| 条件 | 说明 |
|---|---|
账号权限 | 文档:Dameng 需要的权限 |
增量同步准备 | |
网络准备 | 迁移同步节点(sidecar)可连接 ORACLE 标准交互接口(如 1521) |
任务参数
| 参数名称 | 说明 |
|---|---|
fullFetchSize | 全量扫描数据设置的 fetch size |
eventStoreSize | 缓存解析完毕的增量事件缓存大小 |
redoFetchSize | 单次获取 LogMiner 分析数据条数 |
redoOfferTransMaxSize | 未消费但已提交事务最大缓存数量 |
logMiningLsnStep | Dameng LogMiner 分析 redo log 时指定的分析范围大小 |
sqlReplaceKeywords | 将 DDL 语句进行关键字替换,会将 DDL 中的 "key" 替换为 "value",参数结构为哈希结构(e.g.: key: value) |
isDscNode | 是否为 DSC 集群 |
dscHosts | DSC 源端所有节点信息,参数值示例:ip1:port1,ip2:port2,ip3:port3... |
dscSyncLsnTable | DSC 用于同步全局 LSN 的表名称,参数值示例:"DbName"."TableName" |
Tips: 通用参数配置请参考 通用参数及功能