阿里云AnalyticDB for PostgreSQL 以下简称 ADB PG 即原HybridDB for PostgreSQL 为基于PostgreSQL内核的MPP架构的实时数据仓库服务 可以支持复杂ETL任务 也支持高性能在线查询 同阿里云生态紧密结合。
AWS 的Redshift同样为基于PostgreSQL内核引擎的MPP数据仓库服务器 在AWS被广泛作为数据仓库使用。ADB PG和Redshift从架构到语法上同Redshift高度兼容。本文重点介绍两个数仓平台如何进行迁移。
产品架构比较阿里云AnalyticDB for PostgreSQL最新版本 6.0 基于PostgreSQL 9.4构建 Redshift 基于PostgreSQL 8.2版本 相对ADB PG的功能要更加全面 且全面兼容PostgreSQL生态的工具 包括PostGIS MADlib等扩展分析。Redshift 只支持列存表 而不支持PostgreSQL原生的行存表 而ADB PG即保留了PostgreSQL行存表支持 实现高吞吐的数据更新操作 也支持面向OLAP大表聚合操作的列存表。
AnalyticDB for PG 与 Redshift的比较关键语法比较及迁移阿里云AnalyticDB for PostgreSQL与AWS Redshift都基于单机PostgreSQL内核引擎 故语法高度兼容 部分语法描述略有差异如下。
DDL建表语法差异语法指南ADB PG建表指南??
https://help.aliyun.com/document_detail/118150.html
Redshift建表指南??
https://docs.aws.amazon.com/redshift/latest/dg/r_CREATE_TABLE_NEW.html
DDL转换示例1Redshift 建表语句 包含分布键DISTKEY和排序列
CREATE TABLE schema1.table1( filed1 VARCHAR(100) ENCODE lzo, filed2 INTEGER DISTKEY, filed3 INTEGER, filed4 BIGINT ENCODE lzo, filed5 INTEGER,) INTERLEAVED SORTKEY ( filed1, filed2);
ADB PG建表语句
CREATE TABLE schema1.table1 filed1 VARCHAR(100) , filed3 INTEGER, filed5 INTEGER WITH(APPENDONLY true,ORIENTATION column,COMPRESSTYPE zlib) DISTRIBUTED BY (filed2) SORTKEY filed1, filed2 )DDL转换示例2
Redshift 建表语句 包含ENCODE和SORTKEY选项
CREATE TABLE schema2.table2 filed1 VARCHAR(50) ENCODE lzo, filed2 VARCHAR(50) ENCODE lzo, filed3 VARCHAR(20) ENCODE lzo, DISTSTYLE EVEN INTERLEAVED SORTKEY filed1 );ADB PG建表语句
CREATE TABLE schema2.table2( filed1 VARCHAR(50), filed2 VARCHAR(50), filed3 VARCHAR(20)) WITH(APPENDONLY true, ORIENTATION column, COMPRESSTYPE zlib) DISTRIBUTED randomly SORTKEY filed1 );数据迁移
Redshift和ADB PG均支持从云存储的告诉并行数据导入和导出。从Redshift迁移数据到AnalyticDB for PostgreSQL包含如下步骤
资源和环境准备 执行操作前需提前准备Amazon Redshift、Amazon S3 Amazon Simple Storage Service 、AnalyticDB for PostgreSQL和阿里云对象存储服务 OSS 的相关资源。将Redshift的数据导入到Amazon S3中。使用OSSImport将Amazon S3中CSV格式的数据文件导入到OSS。在目标AnalyticDB for PostgreSQL中创建和源Redshift对应的对象 包括模式 Schema 、表 Table 、视图 View 和函数 Function 。使用OSS外部表将数据导入到AnalyticDB for PostgreSQL。整体迁移路径如下
数字化转型的工作在很大程度上取决于数据分析。但是要做出根本性的改变,组织必...
一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式...
本文转载自微信公众号「后端Q」,作者conan。转载本文请联系后端Q公众号。 概述 ...
1.有一个很古老的传说,说是在北邮校园内能看到美女的人会长生不老。 2.床,请...
两种并行发展的趋势正在改变所有行业的信息技术格局:云和人工智能(AI)和机器学习...
数字化转型的加快,让越来越多的用户都能获取所需的计算资源,在云计算向分布式...
对于社会关切的二选一大数据杀熟等平台经济领域垄断行为,如何细化认定?国务院反...
交互式分析(Hologres)2021年4月刊将会为您带来3月产品、技术最新动态,欢迎订...
第一步 创建产品 第二步 定义物模型 第三步 创建设备 完成三步之后就可以进行设...
本文转载自公众号读芯术(ID:AI_Discovery) 随着最新趋势被引入IT领域,QA测试有...