云数据库Greenplum版(ApsaraDB for Greenplum)目前已经开始公测,大家对它的使用评价还是非常高的。但是也有看到朋友反映说在把业务数据同步到云数据库的过程中还有一些不那么灵活的地方。就在前几天,笔者经朋友推荐在阿里云市场找到了这款叫彩虹桥的软件,在用了一段时间后,想在此提一些自己的看法。言而总之在业务数据同步方面,笔者认为彩虹桥应该是greenplum目前最好用的配套辅助工具。

首先让我们来看看正在公测的云数据库Greenplum版。云数据库Greenplum版是基于Greenplum开源数据库项目的MPP大规模并行处理数据仓库产品,提供全面的SQL支持(包括符合SQL2008标准的OLAP分析函数),业界流行的BI软件都可以直接使用Greenplum进行在线业务分析。支持行存储和列存储混合模式,提高分析性能;同时提供数据压缩技术,降低存储成本。支持XML、GIS地理信息、模糊字符串等丰富的数据类型,为物联网、互联网、金融、政企等行业提供丰富的业务分析能力。

阿里云这次不仅将Greenplum云化,还添加了一些非常贴地气的特性,加强了产品的可用性。如今看来,从百TB到PB的OLAP仓库,Greenplum无疑是非常好的选择。但是相信大家在将数据库数据同步到Greenplum的时候,还是存在一些问题,这往往是由业务本身造成的,比如说:

业务数据的数据源类型多,数据散乱;无法对数据任务的基础信息进行控制,如字段,同步频率,抽取方式等,操作繁杂;无法对数据同步的执行情况进行实时的跟踪;不会编程的用户在同步数据的时候存在难以逾越的使用门槛。

现在我们来看看这款配套Greenplum使用的数据同步工具,到底是否好用?它又是如何解决数据同步问题的?带着这两个问题,我们来看看这款数据同步工具。进入彩虹桥以后,我们可以看到有三个功能模块:

  一、数据源管理--配置数据源基础信息,目前支持SQLServer,MySQL,PostgreSQL,Oracle 等数据库到云数据库Greenplum版的数据导入,基本上涵盖了市面上主流的数据源,可以对不同的数据源进行有效的管理。

greenDaod 的eleteInTx 同步还是异步 greenplum 数据同步_数据

greenDaod 的eleteInTx 同步还是异步 greenplum 数据同步_云数据库_02

数据任务的基础信息,包括表名,字段,同步频率,抽取方式等。

greenDaod 的eleteInTx 同步还是异步 greenplum 数据同步_数据_03

greenDaod 的eleteInTx 同步还是异步 greenplum 数据同步_云数据库_04

  三、任务执行情况--查看任务的执行状态,执行时间等,并可以对失败任务进行重试等处理,一目了然。 

greenDaod 的eleteInTx 同步还是异步 greenplum 数据同步_云数据库_05

greenDaod 的eleteInTx 同步还是异步 greenplum 数据同步_数据同步_06

笔者已经体验了两天,最直观的感受就是彩虹桥的配置操作非常灵活简单。简洁的可视化界面,使用了目前非常流行的拖拉拽的操作方式来实现数据的自动同步,即使是不会编程的普通业务人员也能进行完整的操作,而对于有编程基础的业内人员来说,则可以大大的节省时间和精力。以自动建表这个功能为例,用户无需关心复杂的表结构,系统实现自动在云数据库Greenplum版后台创建所需同步的目标表,省去了非常多不必要的麻烦,摆脱平日束缚,更多专注于核心业务。此外,所有操作都是在ECS上完成,目标数据双节点同步冗余,自动化定期备份,能够保护重要数据,可以说彩虹桥有相当不错的安全性。在用户体验上,也可以给到不错的评分。