Kafka 到 Doris
CloudCanal 支持从 Kafka 到 Doris 的数据迁移、同步、校验和链路能力。
选择对端数据库:
Doris
| 功能 | 说明 |
|---|---|
增量实时同步 | 支持订阅源端 Topic 的消息,并转换为 INSERT、UPDATE、DELETE DML |
修改订阅 | 新增、删除、修改订阅 Topic,文档:修改订阅 |
重置位点 | 按 时间戳 回溯位点,重新消费过去一段时间的数据 |
高级功能
| 功能 | 说明 |
|---|---|
消息格式 | 支持以下消息格式,文档:消息格式说明
|
全量前清空目标数据 | 运行全量任务前清除老数据,包括重跑任务、定时全量迁移都会触发此能力 |
重建目标表 | 运行全量任务前重建目标表,包括重跑任务、定时全量迁移都会触发此能力 |
Stream Load 数据写入 | 采用 Stream Load 到 Doris / SelectDB be 写入数据, 默认攒批写入,可动态调节刷出数据节奏和批次大小 |
0 值时间处理 | 支持将 0 值时间设置成不同类型的值,防止写入对端报错 |
限制和注意点
| 限制项 | 说明 |
|---|---|
目标端需要提前创建表 | 仅支持消息自动创建 Topic |
原始消息格式 | 仅支持 Kafka 到 Kafka,且两端的消息格式都需要选择 原始消息格式 |
对端表类型 | 仅支持 唯一键模型(Unique) |
源端表类型 | 不支持 无主键表 迁移同步 |
数据类型 | 不支持 BINARY, BLOB 等二进制类型 |
增量写入冲突策略 | Stream Load 写入以主键进行整行替换 |
使用示例
| 标题 | 详情 |
|---|---|
跨互联网数据互通 (Kafka) | |
Kafka 数据中转校验 | 文档:Kafka 数据中转校验 |
任务参数
| 参数名称 | 说明 |
|---|---|
schemaFormat | MQ 消息格式,文档:消息格式说明 |
consumerGroupId | Kafka 消费组 Id |
consumeParallel | 消费 Kafka 的并行度 |
sessonTimeoutMs | Kafka Session 超时时间(毫秒) |
maxPollRecords | Kafka 一次最大拉取消息数量 |
dbHeartbeatIntervalSec | 配置对源端数据库发起心跳操作的间隔时长 |
dbHeartbeatToleranceStep | 配置对源端数据库心跳操作可容忍的位点差值 |
customClientProps | 自定义 传入到 Kafka Client 参数,JSON 格式,key为参数名,value为参数值。此配置项以最高优先级生效。例如:AWS IAM 访问控制 |
Tips: 通用参数配置请参考 通用参数及功能