🎉 CloudCanal 上线 V6.1.0.0:KingbaseES 分区表迁移性能大幅提升
跳到主要内容

Oracle 到 ClickHouse

CloudCanal 支持从 Oracle 到 ClickHouse 的数据迁移、同步、校验和链路能力。

选择对端数据库:

数据链路

基本功能

功能说明
结构迁移

如目标不存在所选表,则自动根据源端元数据,结合映射生成对端创建语句并执行创建

全量数据迁移

逻辑迁移,通过顺序扫描表数据,将数据分批写入到对端数据库

增量实时同步

支持 INSERT, UPDATE, DELETE 常见 DML 同步

数据校验

全量数据校验, 并支持定时

修改订阅

新增、删除、修改订阅表,支持历史数据迁移,文档:修改订阅

重置位点

时间戳Scn 回溯位点,重新消费过去一段时间 Oracle Redo Log

表名映射

支持 和源端保持一致, 转小写, 转大写, 以'_数字'后缀截取

DDL 同步
  • ALTER TABLE ADD , MODIFY , DROP COLUMN
  • TRUNCATE TABLE
元数据检索

从源端表查对端,查询设置过过滤条件的

高级功能

功能说明
自动建字典

如果使用离线字典解析 Oracle Redo, 则在创建任务时自动创建字典

追加模式写入

INSERT 和 UPDATE 以追加模式批量写入, DELETE 单独通过 ALTER 方式执行

定时优化表

通过设置 autoOptimizeThresholdSec 参数,定时优化表

自定义代码

文档1:创建自定义代码任务
文档2:自定义代码任务 debug
文档3:在自定义代码中打日志

设置目标主键

变更主键为其他字段,方便数据聚合等操作

数据过滤条件

支持 WHERE 条件进行数据过滤,内容为 SQL 92 子集,文档:创建数据过滤任务

限制和注意点

限制项说明
增量同步性能

因 Logminer 有性能上限,且 CloudCanal 未采用并行分析,所以以 3000 条变更/秒 为性能基准

数据类型

不支持 BLOB 及衍生类型

特殊操作

DELETE 操作过多(>50 条/秒)将大幅影响数据同步性能

目标端表引擎

仅支持以下表引擎以及对应的源端表类型:

  • MergeTree(无主键表)
  • ReplacingMergeTree(有主键表)
  • ReplicatedMergeTree(无主键表)
  • ReplicatedReplacingMergeTree(有主键表)

使用示例

标题详情
Oracle 数据迁移同步优化与思考

文档:Oracle 数据迁移同步优化与思考

Oracle 数据迁移同步优化(三)

文档:Oracle 数据迁移同步优化(三)

Oracle 到 ClickHouse 数据迁移同步

文档:Oracle 到 ClickHouse 数据迁移同步


源端数据源

前置条件

条件说明
账号权限

文档:Oracle 需要的权限

增量同步准备

文档:Oracle Logminer 准备

网络准备

迁移同步节点(sidecar)可连接 ORACLE 标准交互接口(如 1521)

任务参数

参数名称说明
fullFetchSize

全量扫描数据设置的 fetch size

eventStoreSize

缓存解析完毕的增量事件缓存大小

logminerUser

执行 Logminer SQL 的 Oracle 连接用户

logminerPasswd

执行 Logminer SQL 的 Oracle 连接密码

logminerConnectType

执行 Logminer SQL 的 Oracle 连接类型(PDB),包括 ORACLE_SID, ORACLE_SERVICE 两种可选

logminerSidOrService

执行 Logminer SQL 的 Oracle 连接串 SID 或服务名(PDB)

parseRedoSqlParallel

解析 Logminer 数据的并发度

parseRedoSqlBufferSize

解析 Logminer 数据的环形队列大小

redoFetchSize

单次获取 Logminer 分析数据条数

redoOfferTransMaxSize

未消费但已提交事务最大缓存数量

oraMiningSessionPauseSec

使用 Logminer 挖掘日志间隙停顿时间,单位为秒

maxEventCountPerTxInMem

内存中每个事务的最大事件数

logMiningScnStep

Oracle Logminer 分析 redo log 时指定的分析范围大小

abandonUnCommitTxTimeoutSec

不带数据变更的事务未提交超过设置的值,则自动放弃该事务

restartTxWithDataTimeoutSec

带数据变更的事务未提交超过设置的值,则自动重启任务

oraUseOnlineDic

是否使用在线日志,false 使用离线日志对 Oracle 压力较大

oraReleaseIntervalSec

重建分析链接的间隔,以释放 Oracle 服务端资源

fallBackScnStep

和 Redo log 最新数据保持的距离,0 表示紧跟

sqlCaseConversionEnabled

是否打开 DDL 大小写转换(根据当前数据库默认大小写规则)

Tips: 通用参数配置请参考 通用参数及功能


目标端数据源

前置条件

条件说明
账号权限

具备 SELECT, INSERT, 常见 DDL 权限

网络准备

迁移同步节点(sidecar)可连接 ClickHouse 标准交互接口(如 8123)

任务参数

参数名称说明
multiReplica

是否为多副本集群

clusterName

集群名称,当 multiReplica 为 true, 则自动在 DDL/DML 中加入 ON CLUSTER clusterName 子句

ckTableEngine

当前支持以下表引擎:

  • MergeTree
  • ReplacingMergeTree
  • ReplicatedMergeTree
  • ReplicatedReplacingMergeTree
autoOptimizeThresholdSec

定时优化表(optimize table final)间隔,<=0 则关闭此功能

enableTimeRangeClamping

是否启用时间范围裁剪,强制将时间和日期值收束到 ClickHouse JDBC 的合法区间内,超出的数值将被截断至最小值或最大值。默认关闭(false)。

收束后范围(UTC):

  • Date:[1970-01-01, 2149-06-06]
  • Date32:[1925-01-01, 2283-11-11]
  • Timestamp:[1970-01-01 00:00:00, 2106-02-07 14:28:15]
  • Timestamp64:[1925-01-01 08:00:00.000, 2283-11-12 07:59:59.000]

Tips: 通用参数配置请参考 通用参数及功能

联系我们
微信二维码

扫码添加微信,获取技术支持