StarRocks
功能 | 说明 |
---|---|
结构迁移 | 如目标不存在所选表,则自动根据源端元数据,结合映射生成对端创建语句并执行创建 |
全量数据迁移 | 逻辑迁移,通过顺序扫描表数据,将数据分批写入到对端数据库 |
修改订阅 | 新增、删除、修改订阅表,支持历史数据迁移,文档:修改订阅 |
表名映射 | 支持 和源端保持一致, 转小写, 转大写, 以'_数字'后缀截取 |
高级功能
功能 | 说明 |
---|---|
全量前清空目标数据 | 运行全量任务前清除老数据,包括重跑任务、定时全量迁移都会触发此能力 |
重建目标表 | 运行全量任务前重建目标表,包括重跑任务、定时全量迁移都会触发此能力 |
增量写入冲突策略 | IGNORE: 主键冲突则忽略(不做写入),REPLACE: 主键冲突则整行替换 |
0 值时间处理 | 支持将 0 值时间设置成不同类型的值,防止写入对端报错 |
自定义代码 | 文档1:创建自定义代码任务 |
数据过滤条件 | 支持 WHERE 条件进行数据过滤,内容为 SQL 92 子集,文档:创建数据过滤任务 |
键值冲突处理 | IGNORE: 冲突则忽略(不做写入),REPLACE: 冲突则整行替换 |
设置目标主键 | 变更主键为其他字段,方便数据聚合等操作 |
任务参数
参数名称 | 说明 |
---|---|
fullBatchSize | 全量写入对端单批数据条数,对迁移性能影响大 |
fullPagingCount | 关系型数据库源端扫描分页大小 |
scanParallel | 源端扫描并发数,如果数据源类型为关系型数据库,则为并发扫描表数量 |
minPoolSize | 数据源最小连接池大小 |
maxPoolSize | 数据源最大连接池大小 |
maxWait | 数据源连接最大超时时间,单位毫秒 |
soTimeoutSec | 数据源链接 tcp SOCKET TIMEOUT 大小 |
Tips: 通用参数配置请参考 通用参数及功能
任务参数
参数名称 | 说明 |
---|---|
keyConflictStrategy | 增量写入遇到主键冲突策略:
|
dstWholeReplace | 将 INSERT 和 UPDATE 操作变成对端整行覆盖 |
deCycle | 双向同步过滤开关,过滤特定标记的 DML/DDL |
specialSqlMode | 初始化数据库链接时,可以设置特定的 sql mode |
defaultGisSRID | 设置 GIS 数据类型的 SRID |
dstTimeZone | 目标端时区,例如 +08:00, Asia/Shanghai, America/New_York等 |
increParallelApplyStrategy | 关系型数据库对端写入数据并行策略:
|
Tips: 通用参数配置请参考 通用参数及功能