跳到主要内容

PostgreSQL

选择对端数据库:

数据链路

基本功能

功能说明
结构迁移

如目标不存在所选表,则自动根据源端元数据,结合映射生成对端创建语句并执行创建

全量数据迁移

逻辑迁移,通过顺序扫描表数据,将数据分批写入到对端数据库

增量实时同步

支持 INSERT, UPDATE, DELETE 常见 DML 同步

数据校验和订正

全量数据校验,并可选根据校验结果订正差异数据,支持定时,文档:创建定时校验订正任务

修改订阅

新增、删除、修改订阅表,支持历史数据迁移,文档:修改订阅

表名映射

支持 和源端保持一致, 转小写, 转大写, 以'_数字'后缀截取

元数据检索

从源端表查对端,查询设置过过滤条件的

高级功能

功能说明
自定义代码

文档1:创建自定义代码任务
文档2:自定义代码任务debug
文档3:在自定义代码中打日志

数据过滤条件

支持 WHERE 条件进行数据过滤,内容为 SQL 92 子集, 文档:创建数据过滤任务

0值时间处理

支持将 0 值时间设置成不同类型的值,防止写入对端报错

限制和注意点

限制项说明
不支持 DDL 同步

因 PostgreSQL wal 日志未提供任何 DDL 相关信息,故无法同步 DDL

主键冲突处理

PostgreSQL <= 9.4 或 Greenplum <= 6,因不支持冲突掠过或覆盖,当大量主键冲突场景下,性能较低

字段类型与映射


源端数据源

前置条件

条件说明
账号权限

需要权限如下(以自建数据库为例):

  • GRANT ALL PRIVILEGES ON DATABASE 同步库 TO 同步账号(或同步库 information_schema 中所有视图的 SELECT 权限和需要同步表、索引、约束的 SELECT 权限)
  • ALTER USER 同步账号 REPLICATION
增量同步准备

准备动作按如下步骤进行:

  • 修改 postgresql.conf, 设置 wal_level=logical 和 wal_log_hints = on
  • 修改 pg_hba.conf, 设置 host replication 同步账号 CIDR网段 md5 , host 同步库 同步账号 CIDR网段 md5, host postgres 同步账号 CIDR网段 md5
  • 重启 PostgreSQL
网络准备

迁移同步节点( sidecar )可连接 PostgreSQL 标准交互接口(如 5432)

任务参数

参数名称说明
fullFetchSize

全量扫描数据设置的 fetch size

eventStoreSize

缓存解析完毕的增量事件缓存大小

ignoreGisSRID

解析 GIS 数据类型时是否忽略 SRID

defaultGisSRID

设置 GIS 数据类型的 SRID

Tips: 通用参数配置请参考 通用参数及功能


目标端数据源

前置条件

条件说明
账号权限

具备 SELECT, INSERT, DELETE, UPDATE,常见 DDL 权限
阿里云 AnalyticDB for Pg 初始账号,或有 SELECT, INSERT, DELETE, UPDATE, 常见 DDL 权限

网络准备

迁移同步节点( sidecar )可连接 PostgreSQL / Greenplum / AnalyticDB for Pg 标准交互接口(如 5432)

任务参数

参数名称说明
keyConflictStrategy

写入遇主键冲突处理策略,IGNORE 冲突忽略(默认),REPLACE 冲突替换(可选),EXCEPTION 报错停止(可选)

dstWholeReplace

将 INSERT 和 UPDATE 操作变成对端的整行覆盖

enableTimeZoneProcess

是否对时间字段进行时区转换

timezone

需要转换的目标时区

defaultZeroDate

在遇到'0000-00-00 00:00:00' / '0000-00-00' 值时用于替换的默认值,可选参数有:null(空值), 时间(14:23:33), 日期(1970-01-01), 时间日期(1970-01-01 00:00:00), 时区时间(14:23:33+08:00 或 1970-01-01 00:00:00+08:00)

caseSensitive

对端写入SQL语句表名大小写策略,包含 UpperCase(转大写), LowerCase(转小写), Sensitive(添加限定符), NoSpecified(不转换/不加限定符)

writeStrategy

对端写入策略,包含 ROW(单条), MULTI_SQL(多语句), BATCH(批量,默认选项), COPY(PostgreSQL COPY 指令)

defaultGisSRID

设置 GIS 数据类型的 SRID

Tips: 通用参数配置请参考 通用参数及功能

数据链路

基本功能

高级功能

限制和注意点

使用示例

字段类型与映射

链路FAQ

源端数据源

前置条件

任务参数

目标端数据源

前置条件

任务参数