当前位置：主页 > 查看内容

云原生演进趋势下传统数据库升级实践

发布时间：2021-08-12 00:00| 有位朋友查看

简介：一、概述云原生数据库一云计算是数字化的基础设施众所周知目前云计算已经成为数字化的基础设施整个社会也在数字化。数字化渗透进我们的日常生活中除了衣食住行还包括教育、医疗、游戏等。以医疗领域为例早些年去医院不管是验血还是拍胸片一定是要……

一、概述云原生数据库

一云计算是数字化的基础设施

众所周知目前云计算已经成为数字化的基础设施整个社会也在数字化。数字化渗透进我们的日常生活中除了衣食住行还包括教育、医疗、游戏等。

以医疗领域为例早些年去医院不管是验血还是拍胸片一定是要去取纸质报告然后打一张塑料的胸片图。但是最近一两年除了三甲医院其他医院也基本是通过网上向患者提供无论是报告还是胸片之类的材料医疗领域数字化现象十分明显。

而这些数据全部都数字化以后面临一个非常大的问题它在哪些平台承载怎么样承载阿里云是其中非常重要的一个环节数据库在数字化进程中承载了数据的生产、集成、实时处理和分析的整套流程。在整个数据库周边可能还有硬件、安全、弹性计算等能力这些大大小小的东西最终组成阿里云这个平台。

二什么是云原生数据库技术

云计算在重塑数据库技术与商业。

在数字化背景下我们有许多思考。

数据库跟以前那有什么不一样呢什么是所谓的云原生数据库呢作为使用数据库的开发者对数据库的需求有什么变化如今使用数据库我们一般会提什么样的诉求

如今上层的业务变化非常快包括以前阿里巴巴淘宝内部其实也有同样的问题。业务的快速变化让开发者面临一个非常大的挑战就是要非常快速地适应变化。在云普及之前这个过程其实还是比较慢的从构建服务器然后网络打好安装操作系统和数据库等整个流程非常长。

对数据库的诉求总结起来可能有以下几个。

第一个就是我们希望更专注在业务开发上不要把太多时间放在底层的硬件、软件、机房、网络等设施的配置上。

第二个是开箱即用的我们希望数据库创建好了可以直接使用不需要再去做配置、优化等非常繁琐耗时且专业性强的事情。

第三个是安全可信把数据放在第三方平台上安全可信是一个非常基本的要求。

第四个是开放兼容我们不希望被哪个云厂商锁定希望能非常自由地迁移进来和迁移出去。

第五个是海量扩展随着业务爆发式的增长系统压力很快就会变成原来的数倍甚至数十倍。在这种情况下如果没有一个很好的横向、纵向扩展的数据库系统那么很难支撑业务正常运行处理起来就会非常棘手。

第六个是全球化。中国很多游戏厂商在海外的拓展和推广做得非常不错尤其是在东南亚一带另外也有一些游戏在欧美日本获得了非常大的成功所以现在有些开发者也面临着全球化的诉求作为数据库的基础设施应该思考如何提供全球化的能力。

第七个是持续可用我们原来自己做一套数据库系统持续可用也是核心考虑之一。

除此之外还有可靠性要求不能发生数据丢失。

最后是低成本当业务发展到比较成熟的阶段我们会关注低成本。

在这些客户诉求下我们思考下一代数据库或者说新的数据库要具备哪些特性也就是云原生数据库它所具备的产品能力如下所示。

第一个是全面托管用户不再需要去关注安装、备份、部署、监控、高可用等可以一键创建实例创建出来的实例具备以上东西。

第二个是按量付费按量付费可以让业务起步的成本变得非常低否则机房、硬件、网络等一整套设施配置下来成本非常高昂。

第三个是按需弹性它分为两个方面一方面是要具备往上弹的能力当业务在快速发展的过程中数据库也要能够快速往上弹。另一方面是往下弹当业务高峰过去了需要很快地把资源使用量降下来达到降低成本的目的。

第四个是生态兼容无论用户目前使用的是MySQL 还是Oracle 或者是其他数据库我们能迁移进来也能迁移出去。

上方是我们认为云原生数据库它所具备的产品能力。

在这些产品能力底下还是有很多的技术在支持。

六大核心技术分别是智能化、多模、软硬件一体化、安全可信、HTAP 大数据库数据库一体化、云原生分布式。这六大核心技术支撑了上文的产品能力解决开发者诉求。

三云原生关系型数据库 PolarDB

PolarDB是阿里巴巴自研的新一代云原生数据库在存储计算分离架构下利用了软硬件结合的优势为用户提供具备极致弹性、高性能、海量存储、安全可靠的数据库服务。100%兼容MySQL 5.6/5.7/8.0 PostgreSQL 11 高度兼容Oracle。

PolarDB-X为PolarDB分布式版本融合分布式SQL引擎与分布式自研存储X-DB 专注解决海量数据存储、超高并发吞吐、复杂计算与分析等问题。

四云原生关系型数据库PolarDB产品架构

PolarDB产品架构图

PolarDB产品有以下特性

存储计算分离

1 分钟级弹性升降级

2 分钟级新增/删除只读节点

智能代理转发

1 实现数据库透明扩容

2 多种一致性级别

3 自定义Endpoint

分布式存储

1 支持100TB

2 快速备份与恢复

3 更高单实例IO能力

libpfs rdma optane

1 高性能透明实现三副本 RPO 0

2 高性能写入实现高并发的写入

基于redo复制

1 只读实例毫秒级延迟

2 解决binlog/redo双日志一致性与性能问题

并行执行

1 部分场景下的查询与分析

2 可以自由控制的并行度保障性能与稳定性

这里主要讲一个和开发者使用过程中关系比较大的特性智能代理转发。

在数据库中有一个非常难的点它跟应用服务器不一样当应用服务器系统压力特别大的时候还是比较容易做扩展的可以加一组应用服务器把相关的流量扩展到新的应用服务器上就可以了。

但数据库通常做不到因为数据在查询和使用上都是相互关联的数据不能简单地做拆分。PolarDB在上层有一个智能代理层叫Proxy 它为开发者解决了这个问题。当数据库系统压力特别大的时候通过智能代理可以自动把一些查询的Query分发到别的只读节点上。比如原来是一主一备可以变成一主三备就可以把流量自动分发到三个节点。

大家可能想这个不就跟原来数据库加几个备库是一样的道理吗

PolarDB通过智能代理解决了一个非常关键的问题那就是加了这些只读节点以后应用服务器上的连接配置是不需要做任何改动可以随时加上去智能代理收到Query以后会自动转发过去。

以现实业务场景举例比如某天前端的业务系统告诉我们明天早上10点要做一个促销活动请做好数据库的扩容。

以前如果加了只读节点可能遇到的问题是前端应用服务器根本就访问不到这个只读节点或者可以访问到只读节点但要对应用服务器的配置做一些改变可能导致应用要把应用服务器重启。现在通过PolarDB的智能代理可以有效解决这个问题方便快捷地做容量扩展。

二、传统关系型数据库向云原生环境迁移

一传统商业数据库替换的挑战

如今如果要从别的商业数据库迁移到 PolarDB上比如从Oracle数据库一般来说有几个比较大的挑战。

第一个挑战是应用耦合度高。通常情况下数据库跟应用的耦合度非常高如果要对数据库做一个动作的话应用前端的应用要配合着一起做可能会影响前端的可用性因为通常情况下数据库底下承载的业务都是比较关键的动数据库往往意味着动前端应用。

第二个挑战是稳定性要求高。数据库一出问题前端的业务就会出问题所以数据库的变更和动作经常会在晚上执行。

第三个挑战是数据量大。由于现在业务都比较大因此核心数据库的数据量通常会比较大。

第四个挑战是语法兼容要求高。虽然大家使用的都是 SQL 但是不同数据库的SQL还是不一样的。如果从Oracle数据库迁移到PolarDB SQL要做太多的改造的话就意味着前端业务系统的改造要非常大情况也很复杂。

二使用云原生数据库PolarDB替换传统商业数据库

是一个科学的标准化、产品化的过程。

迁移流程图

在阿里云上我们会提供一套标准化流程和产品帮助用户从原始数据库移到PolarDB数据库。

首先我们会给用户一个工具或者脚本到用户的系统里面运行一下它可以采集到用户数据库的一些特征这个特征包括有哪些 SQL、函数、存储过程跟目标数据库写法不匹配原始的数据库的特点比如它是一个系统压力特别大的数据库还是一个热点数据特别明显的数据库。探测到这些点后会告诉用户在后期的改造中要注意什么问题。

上方表格就是在实际的业务过程中通过脚本跑出来的。

通过这个表格我们可以看到原始数据库如果要迁移到PolarDB的时候它整体的兼容性还是比较高的。我们一共探测了6029个对象这个对象可能包括存储过程、数据表、索引序列还有一些同义词等相关的东西其中不兼容的对象只有两个其实是比较少的。报表里会指出具体是哪两个表里面也有一些比较具体的修改建议然后就可以迁移过来了。

下图是一个比较具体的过程此处不详细展开阐述。

目前阿里云已经把这一套标准化、产品化的流程和中国信通院一起做成了数据库迁移的标准指南开发者可以到网上查阅遵照指南做数据库迁移。

三、管理PolarDB?O引擎兼容Oracle语法

一 PolarDB提供面向Oracle的全栈兼容性

PolarDB提供的Oracle兼容性是包括多个方面的除了语法层的兼容还有物理存储层、逻辑层和接口层。

二管理PolarDB O引擎兼容Oracle语法常用工具

如果用户从Oracle迁移过来在使用或者管理PolarDB的时候和原来有哪些不一样

在管理工具方面用户可以使用阿里云云端的数据管理平台DMS 在控制台上找到叫登录数据库的入口就可以登录到DMS上如下所示。

第二个是用开源的数据管理平台叫pgAdmin 在这个平台上可以做基本的数据管理操作包括基础信息的查看数据查询看一些执行计划、表、对象等如下所示。

四、PolarDB O引擎兼容Oracle语法的开发实践数据库基本规范

管理PolarDB O引擎兼容Oracle语法开发规范 1

另外阿里云有一些常用的开发规范开发规范是阿里云内部探索出来的也称为规约在阿里巴巴内部是比较严格遵守执行的未来会发布在开发者社区和阿里云的文档体系中。开发规范分成几个方面有些地方和开发者在具体使用PolarDB的时候关系会比较大下面简单阐述一下。

规范中有一些是我们内部要求强制执行有一些则是推荐执行用户可以根据自己的实际情况进行取舍。

上方为建表规约。比如有一个对字段名的规范要求必须要用小写字母和数字不能用关键字为什么会有这样的规范因为字段名的修改是一个代价比较大的事情通常不能“预发”。

我们发现在实际的生产过程中改一个字段名是非常麻烦的。因为前面的业务已经在运行如果改一个字段名就意味着业务系统不能正常运行。所以以前大多数的做法就是加新的字段因此我们对字段名提了一些规范比如只能用小写字母不能用关键字等。

第二个是表名和字段名我们要求加create_time和 update_time。这会带来几个好处第一个就是如果数据发生错误的时候你可以很快知道字段的修改情况和时间。第二个是在上下游系统里面如果要拉取一些变化数据的时候它也可以非常快地找到哪些数据发生了变化然后去做对应的处理。

另外表必须有主键。这里有几个原因第一个是查询性能会非常好第二个是在下游的系统拉取一些变化的数据的时候它通过主键可以比较快速地拿到。

此外还有一系列的索引规约如上图所示。

规约中提到索引的建立要有顺序这个顺序的考虑可能会去关注where条件里面有哪些字段要注意order by条件里面字段的顺序这个顺序可能要影响索引建立的字段顺序只有它们两个比较匹配的时候整个的性能才会比较好。

另外如果可以用覆盖索引查询的时候尽量用覆盖查索引查询会大大增加效率。

规约中还有一个推荐项利用延迟关联或者子查询优化超多分页场景。这也是我们在数据库的索引优化里面的经验。当做分页查询的时候比如说当你翻到了第1000页或者是第500页这样靠后的页面时这时候建议的做法是比如说翻页要查出10页的内容最好先把这10页内容的主键ID先查出来查出来之后再回表一次把所有的数据查出来这是一个比较常见的推荐做法。

另外索引规约里面还提到一条就是要注意不同字段类型尽可能少或者不要发生隐式转换因为隐式转换会导致整个索引失效。

管理PolarDB O引擎兼容Oracle语法开发规范 2

SQL和运维也有许多规约这里主要讲一下运维方面其中几个点。

首先是数据订正开发者如果要去做一些修改数据的话一定要先把这些数据查询出来先看一遍再去做删除要不然的话很容易出现误删除。

另外推荐使用数据管理产品DMS。如果在DMS上做数据订正的话它有一个好处是可以勾选备份当做数据订正的时候它会自动把所有要订正的数据全部做一个备份。如果发现数据订正出了问题的时候可以找到DMS自动备份下来的数据重新再把这个数据恢复起来。

其他的这些这里不做过多阐述未来会发布在开发者社区和阿里云的文档体系中。

五、PolarDB O引擎兼容Oracle语法的开发实践常见的SQL优化

一管理 PolarDB O引擎兼容Oracle语法 SQL优化案例一并行查询

当查一些带复杂计算的Query 用并行查询可以大大加速查询效率。

上方是一个简单的例子在GROUP BY的时候有一个非常简单的计算当这个Query要扫描的数据非常多的时候开一个并行查询可以让耗时从原来的100多秒到10秒时间速度翻了10倍这是用户在使用PolarDB的一个小技巧。

二管理PolarDB O引擎兼容Oracle语法 SQL优化案例二选择合适的JOIN方式

我们支持hash join merge join和nest-loop join 用户可以根据不同的场景选择合适的Join方式。

可以看到在上面这个案例中选择nest-loop join是最快的。

六、案例与认可

一完整的数据库生态

虽然PolarDB是一个单独的产品但是它有非常完善的产品生态包括数据管理DMS 数据自治服务DAS 数据传输DTS 数据库备份DBS 数据与应用迁移ADAM等可以满足用户各种场景带来全方位的服务。

二案例 PolarDB助力PrestoMall平滑从Oracle迁移上云

PrestoMall 是一家成立于2014年的东南亚电商企业为了应对业务的快速增长阿里云数据库PolarDB助力PrestoMall平滑从Oracle迁移上云。

迁移上云主要面临以下业务挑战

业务快速发展 IT 费用也随之水涨船高 Oracle成本高昂业务的快速增长应对双十一大促乏力应用具备水平扩展的能力但是数据库弹性不足去O复杂度太高缺乏经验希望有专业评估指导最优迁移成本控制风险成为难题。

根据客户业务需求我们制定了迁移至PolarDB O 兼容Oracle语法的方案原因是

PolarDB O引擎兼容Oracle语法作为云数据库没有昂贵的license费用 PolarDB O引擎兼容Oracle语法云原生弹性解决客户数据库弹性不足的问题 ADAM为客户提供专业的数据库/应用兼容性评估报告制定完善的迁移计划结合PolarDB O引擎兼容Oracle语法对Oracle的高兼容性大幅提升改造效率 DTS实时迁移/回流的功能配合专家服务大幅缩短割接时间并降低风险。

迁移到PolarDB O引擎兼容Oracle语法后通过最终实现了以下客户价值

PolarDB O引擎兼容Oracle语法在成功支撑客户业务的同时公司整体IT成本降低40% 双十二大促PolarDB O引擎兼容Oracle语法弹性升级应对自如 ADAM PolarDB?O引擎兼容Oracle语法帮助客户代码改造成本降低93% 在计划内顺利平稳完成割接业务稳定运行。

三被广泛认可的云原生关系型数据库PolarDB

目前 PolarDB在业界受到非常广泛的认可顶级学会的论文已经超过了10篇了获得了今年中国电子学会的科技进步一等奖还有一些其他权威荣誉。

随机推荐

VPS主机和租用服务器优势分析

在TOP云（zuntop.com）科技租赁过服务器的站长都知道独立服务器在价格上比VPS主...
华瑞银行金融一朵云安全建设实践，智慧银

中国最?好的一朵云飘进了华瑞银行。阿里云将进一步助力华瑞银行All in Cloud。 -...
在DevOps中整合“安全即代码”文化

最近，DevOps的采用导致了企业计算的重大转变。除无服务器计算，动态配置和即付...
RDS PostgreSQL 安全最佳实践

一、PostgreSQL行业位置一行业位置首先我们看一看RDS PostgreSQL在整个行业当...
MySQL Case-索引key对select count(*)的

查看表结构，sbtest1有主键、k_1二级索引、i_c二级索引 CREATE TABLE `sbtest1` ...
云计算市场在2020年取得突破性增长

2020年对于云计算行业来说是突破性的一年，因为公共云供应商增加了收入，而疫情...
阿里云发布工业大脑3.0，满足一站式开发

9月17日，2020云栖大会上，阿里云正式发布工业大脑3.0。阿里云智能资深产品专家...
关于现代包管理器的深度思考-为什么现在

很长时间没有更新原创文章了，但是还一直在思考和沉淀当中，后面公众号会更频繁...
Nacos或者Config是怎么实现配置热刷新的

本文转载自网络，原文链接：https://mp.weixin.qq.com/s/vlOUg46B5bcmToX-fjavJQ...
JavaScript之深入理解this

定义 this是函数运行时自动生成的内部对象，即调用函数的那个对象。（不一定很准...

云原生演进趋势下传统数据库升级实践

推荐图文

新零售行业优质解决方案分享【智能语音点餐机解决方

2021年值得关注的8种边缘计算趋势

尽管获三千万融资，该域名也换得了吧！

租用云服务器一年大概的费用

P2P鼻祖收购四字母域名LCAM.com！梦工厂、百事均有

服务器托管节省开支节省费用

随机推荐

VPS主机和租用服务器优势分析

华瑞银行金融一朵云安全建设实践，智慧银

在DevOps中整合“安全即代码”文化

RDS PostgreSQL 安全最佳实践

MySQL Case-索引key对select count(*)的

云计算市场在2020年取得突破性增长

阿里云发布工业大脑3.0，满足一站式开发

关于现代包管理器的深度思考-为什么现在

Nacos或者Config是怎么实现配置热刷新的

JavaScript之深入理解this

关于我们