PostgreSQL 到 ClickHouse
CloudCanal 支持从 PostgreSQL 到 ClickHouse 的数据迁移、同步、校验和链路能力。
| 功能 | 说明 |
|---|---|
结构迁移 | 如目标不存在所选表,则自动根据源端元数据,结合映射生成对端创建语句并执行创建 |
全量数据迁移 | 逻辑迁移,通过顺序扫描表数据,将数据分批写入到对端数据库 |
增量实时同步 | 支持 INSERT, UPDATE, DELETE 常见 DML 同步 |
数据校验 | 全量数据校验, 并支持定时 |
修改订阅 | 新增、删除、修改订阅表,支持历史数据迁移,文档:修改订阅 |
重置位点 | 支持按照文件位点、时间戳 回溯位点,重新消费过去一段时间或指定 Binlog 文件和位点开始的增量日志 |
表名映射 | 支持 和源端保持一致, 转小写, 转大写, 以'_数字'后缀截取 |
DDL 同步 | PostgreSQL DDL 同步基于 触发器 实现,需具备相应的 触发器 和 表 权限。文档:PostgreSQL 需要的权限
|
元数据检索 | 从源端表查对端,查询设置过过滤条件的,查询设置过对端主键的 |
高级功能
| 功能 | 说明 |
|---|---|
追加模式写入 | INSERT 和 UPDATE 以追加模式批量写入, DELETE 单独通过 ALTER 方式执行 |
定时优化表 | 通过设置 autoOptimizeThresholdSec 参数,定时优化表 |
定时全量迁移 | 文档1:创建定时全量任务 |
自定义代码 | 文档1:创建自定义代码任务 |
数据过滤条件 | 支持 WHERE 条件进行数据过滤,内容为 SQL 92 子集,文档:创建数据过滤任务 |
设置目标主键 | 变更主键为其他字段,方便数据聚合等操作 |
添加虚拟列 | 支持添加自定义的虚拟列,指定的值为固定值,如区域、编号等 |
限制和注意点
| 限制项 | 说明 |
|---|---|
特殊操作 | DELETE 操作过多(>50 条/秒)将大幅影响数据同步性能 |
目标端表引擎 | 仅支持以下表引擎以及对应的源端表类型:
|
前置条件
| 条件 | 说明 |
|---|---|
账号权限 | 需要权限如下(以自建数据库为例):
|
增量同步准备 | 准备动作按如下步骤进行:
|
网络准备 | 迁移同步节点(sidecar)可连接 PostgreSQL 标准交互接口(如 5432) |
任务参数
| 参数名称 | 说明 |
|---|---|
fullFetchSize | 全量扫描数据设置的 fetch size |
eventStoreSize | 缓存解析完毕的增量事件缓存大小 |
ignoreGisSRID | 解析 GIS 数据类型时是否忽略 SRID |
defaultGisSRID | 设置 GIS 数据类型的 SRID |
Tips: 通用参数配置请参考 通用参数及功能