跨互联网数据互通 (Kafka)
· 阅读需 8 分钟
简介
本文主要介绍如何使用 CloudCanal 快速构建安全的混合云在线数据生态。
此方案具有以下几个特点
- 采用 Kafka 做数据中转
- 双边 数据库都不开公网端口
- 互联网数据经过 SSL 加密
- 数据出口经过用户名、密码验证,并设置 ip 白名单加强安全管控
例子中的云数据库、云消息产品、自建数据库等都可以替换成自己当前环境的自建资源或各种云资源。
技术点
混合云数据生态主要的难点在于 网络安全 ,部分用户因为传输同步数据较多,也比较在意流量资源损耗。
基于 CloudCanal 实现的方案,更加关注 网络安全 层面的问题,做到敏感资源 网络单向隔离、链接鉴权、传输加密。
下图简要示例了下 互联网模式 和 专线模式 数据上下云。

举个"栗子"
本文案例主要演示 互联网模式 的跨云数据迁移和同步,具体场景是如何进行数据上云(自建机房数据库-> 阿里云云数据库),并且长期维持混合云数据体系。当然,相同的方案也可以反过来使用,只是在数据源选择外网内网有所区别。
安装 CloudCanal
- 请参考 全新安装(Docker Linux/MacOS),下载安装 CloudCanal 私有部署版本。
准备 Kafka
- 在 阿里云 Kafka 购买页 购买相应的 Kafka , 验证能力可先购买按量实例
- 注意选择 公网/VPC实例,并且选择稍大的公网流量
- 部署实例请选择 2.x.x 版本,最大消息大小 建议调整稍大些(比如 4MB)

- 进入实例,创建 Consumer Group,并记下名称

