Google Drive
功能 | 说明 |
---|---|
结构迁移 | 如目标不存在所选表,则自动根据源端元数据,结合映射生成对端创建语句并执行创建 |
全量数据迁移 | 逻辑迁移,通过顺序扫描表数据,将数据分批写入到对端数据库 |
修改订阅 | 新增、删除、修改订阅表,支持历史数据迁移,文档:修改订阅 |
表名映射 | 支持 映射为别名, 和源端保持一致, 转小写, 转大写, 以'_数字'后缀截取 |
高级功能
功能 | 说明 |
---|---|
0 值时间处理 | 支持将 0 值时间设置成不同类型的值,防止写入对端报错 |
表格检索范围 | 表格的数据检索范围(A1 表示法或 R1C1 表示法) |
自定义代码 | 文档1:创建自定义代码任务 |
限制和注意点
限制项 | 说明 |
---|---|
同步文件类型限制 | 暂时仅支持同步 Google Doc、Google Sheet 文件,其他文件类型暂不支持同步 |
Sheet 表格 NULL 数据同步限制 | Google Sheet API 会忽略末尾为空的单元格。因此末尾空单元格同步到对端为 null,中间的空单元格同步到对端为空字符串,空行会直接忽略 |
主键冲突处理 | PostgreSQL <= 9.4 或 Greenplum <= 6, 因不支持冲突掠过或覆盖,当大量主键冲突场景下,性能较低 |
任务参数
参数名称 | 说明 |
---|---|
projectId | Google Cloud 项目 ID |
privateKeyId | Google Cloud 服务账号私钥 ID |
privateKey | Google Cloud 服务账号私钥 |
clientEmail | Google Cloud 服务账号邮箱 |
clientId | Google Cloud 服务账号 ID |
maxLines | 如果同步的是 Google Docs 文档,意为一条数据的最大行数;如果同步的是 Google Sheets 表格,意为一批数据包含的最大行数 |
maxChars | 如果同步的是 Google Docs 文档,意为一条数据的最大字符数 |
skipRows | 跳过 Google Sheet 文件的头 n 行数据,如果一个文件返回多个 Sheet,则每个 Sheet 都会跳过相同的行数 |
Tips: 通用参数配置请参考 通用参数及功能
前置条件
条件 | 说明 |
---|---|
账号权限 | 具备 SELECT, INSERT, DELETE, UPDATE, 常见 DDL 权限 |
网络准备 | 迁移同步节点(sidecar)可连接 PostgreSQL / Greenplum / AnalyticDB for Pg 标准交互接口(如 5432) |
任务参数
参数名称 | 说明 |
---|---|
keyConflictStrategy | 增量写入遇到主键冲突策略:
|
dstWholeReplace | 将 INSERT 和 UPDATE 操作变成对端的整行覆盖 |
enableTimeZoneProcess | 是否对时间字段进行时区转换 |
timezone | 目标端时区,例如 +08:00, Asia/Shanghai, America/New_York |
defaultZeroDate | 在遇到'0000-00-00 00:00:00' / '0000-00-00' 值时用于替换的默认值,可选参数有:
|
caseSensitive | 对端写入SQL语句表名大小写策略,包含
|
writeStrategy | 对端写入策略,包含
|
defaultGisSRID | 设置 GIS 数据类型的 SRID |
Tips: 通用参数配置请参考 通用参数及功能