当前位置：主页 > 查看内容

Hologres揭秘：如何支持超高QPS在线服务（点查）场景

发布时间：2021-07-23 00:00| 有位朋友查看

简介：Hologres 中文名交互式分析是阿里云自研的一站式实时数仓这个云原生系统融合了实时服务和分析大数据的场景全面兼容PostgreSQL协议并与大数据生态无缝打通能用同一套数据架构同时支持实时写入实时查询以及实时离线联邦分析。它的出现简化了业务的架构为……

Hologres 中文名交互式分析是阿里云自研的一站式实时数仓这个云原生系统融合了实时服务和分析大数据的场景全面兼容PostgreSQL协议并与大数据生态无缝打通能用同一套数据架构同时支持实时写入实时查询以及实时离线联邦分析。它的出现简化了业务的架构为业务提供实时决策的能力让大数据发挥出更大的商业价值。从阿里集团诞生到云上商业化随着业务的发展和技术的演进 Hologres也在持续不断优化核心技术竞争力为了让大家更加了解Hologres 我们计划持续推出Hologres底层技术原理揭秘系列从高性能存储引擎到高效率查询引擎高吞吐写入到高QPS查询等全方位解读Hologres 请大家持续关注

往期精彩内容

2020年VLDB的论文《Alibaba Hologres: A cloud-Native Service for Hybrid Serving/Analytical Processing》Hologres揭秘首次公开阿里巴巴云原生实时数仓核心技术揭秘Hologres揭秘首次揭秘云原生Hologres存储引擎Hologres揭秘 Hologres高效率分布式查询引擎Hologres揭秘高性能原生加速MaxCompute核心原理Hologres揭秘优化COPY 批量导入性能提升5倍

本期我们将揭秘Hologres如何支持超高QPS点查。

传统的 OLAP 系统在业务中往往扮演着比较静态的角色以通过分析海量的数据得到业务的洞察比如说预计算好的视图、模型等从这些海量数据分析到的结果再通过另外一个系统提供在线数据服务比如HBase、Redis、MySQL等。这里的服务 Serving 和分析 Analytical 是个割裂的过程。与此不同的是实际的业务决策过程往往是一个持续优化的在线过程。服务的过程会产生大量的新数据我们需要对这些新数据进行复杂的分析。分析产生的洞察实时反馈到服务让业务的决策更实时从而创造更大的商业价值。

Hologres定位是一站式实时数仓融合分析能力 Analytical 与在线服务(Serving)为一体减少数据的割裂和移动。本文的内容将会针对Hologres的服务能力核心为点查能力介绍Hologres到底具备哪些服务能力以及背后的实现原理。

通常我们所说的点查场景是指Key/Value查询的场景广泛用于在线服务。由于点查场景的广泛需求市场上存在多种KV数据库定位于支持高吞吐、低延时的点查场景例如被大家广而熟知的HBase 它通过自定义的一套API来提供点查的能力在许多业务场景都能够获得较好的效果。但是HBase在实际使用中也会存在一定的缺点这也使得很多业务从HBase迁移至Hologres 主要有以下几点

当数据规模大到一定程度的时候 HBase在性能方面将会有所下降无法满足大规模的点查计算同时在稳定性上也变得不如人意需要有经验的运维支持HBase提供的是自定义API 上手有一定的成本。Hologres直接通过SQL提供高吞吐、低延时的点查服务。相比于其它KV系统提供自定义API SQL接口无疑更加的简单易用。HBase采用Schema Free设计没有数据类型对于检查数据质量修正数据质量也带来了复杂度查错难修正难。Hologres具备与Postgres兼容的几乎所有主流数据类型可以通过Insert/Select/Update/Delete标准SQL语句对数据进行查看、更新。在Hologres中的点查场景是指行存表基于主键 PK 的查询。

--建行存表
BEGIN;
CREATE TABLE public.holotest (
 a text NOT NULL,
 b text NOT NULL,
 c text NOT NULL,
 d text NOT NULL,
 e text NOT NULL,
PRIMARY KEY (a,b)
CALL SET_TABLE_PROPERTY( public.holotest , orientation , row );
CALL SET_TABLE_PROPERTY( public.holotest , time_to_live_in_seconds , 3153600000 );
COMMIT;
-- Hologres通过SQL进行点查
select * from table where pk ?; -- 一次查询单个点
select * from table where pk in (?, ?, ?, ?, ?); -- 一次查询多个点

点查场景技术实现难点

正常情况下一条SQL语句的执行需要经过SQL Parser进行解析成AST 抽象语法树再由Query Optimizer处理生成Plan 可执行计划最终通过执行Plan拿到计算结果。而要想通过SQL做到高吞吐、低延时、稳定的点查服务则必须要克服如下困难

在不破坏PostgreSQL生态的情况下 SQL接口如何做到高QPS 如何做低甚至避免SQL解析与优化器的开销一套高效的Client SDK如何与后端存储进行交互如何在低消耗的情况下做到高并发的交互如何减少消息传递过程中的开销如何感知后端的压力、配合做到最好的吞吐与延迟后端存储如何在高性能的情况下更加稳定如何最大化利用cpu资源如何减少各种内存的分配与拷贝、避免热点key等问题对系统带来的不稳定性如何减少冷数据IO的影响

在克服上述3大类困难后整体的工作方式就可以非常的简洁在接入层(FrontEnd)上直接通过Client SDK与后端存储通信。

点查1.png

下面将会介绍Hologres是如何克服以上3大困难从而实现高吞吐低延时的点查。

降低、避免SQL解析与优化器的开销Query Optimizer进行Short Cut

由于点查的Query足够简单 Hologres的Query Optimizer进行了相应的short cut 点查Query并不会进入Opimizer的完整流程。Query进入FrontEnd后它会交由Fixed Planner进行处理并由其生成对于的Fixed Plan 点查的物理Plan Fixed Planner非常轻无需经过任何的等价变换、逻辑优化、物理优化等步骤仅仅是基于AST树进行了一些简单的分析并构建出对应的Fixed Plan 从而尽量规避掉优化器的开销。

Prepared Statement

尽管Query Optimizer对点查Query进行了short cut 但是Query进入到FrontEnd后的解析开销依然存在、Query Optimizer的开销也没有完全避免。

Hologres兼容Postgres Postgres的前、后端通信协议有extended协议与simple协议两种

simple协议是一次性交互的协议 Client每次会直接发送待执行的SQL给Server Server收到SQL后直接进行解析、执行并将结果返回给Client。simple协议里Server无可避免的至少需要对收到的SQL进行解析才能理解其语义。extended协议 Client与Server的交互分多阶段完成整体大致可以分成两大阶段。第一阶段 Client在Server端定义了一个带名字的Statement 并且生成了该Statement所对应的generic plan(不与特定的参数绑定的通用plan)。

点查2.png

第二阶段用户通过发送具体的参数来执行第一阶段中定义的Statement。第二阶段可以重复执行多次每次通过带上第一阶段中所定义的Statement名字以及执行所需要的参数使用第一阶段生成的generic plan进行执行。由于第二阶段可以通过Statement名字和附带的参数来反复执行第一个阶段所准备好的generic plan 因此第二个段在Frontend的开销几乎等同于0。

为此Hologres基于Postgres的extended协议支持了Prepared Statement 做到了点查Query在Frontend上的开销接近于0。

高性能的内部通信

BHClient是Hologres实现的一套用于与后端存储直接通信的高效Private Client SDK 主要有以下几个优势

1 Reactor模型、全程无锁的异步操作

BHClient工作方式类似reactor模型每个目标shard对应一个eventloop 以“死循环”的方式处理该shard上的请求。由于HOS对调度执行单元的抽象即使是shard很多的情况下这种工作方式的基础消耗也足够低。

2 高效的数据交换协议binary row

通过自定义一套内部的数据通信协议binary row来减少整个交互链路上的内存的分配与拷贝。

3 反压与凑批

BHClient可以感知后端的压力进行自适应的反压与凑批在不影响原有Latency的情况下提升系统吞吐。

稳定可靠的后端存储1 LSM(Log Structured Merge Tree)

Hologres的行存表采取LSM进行存储相比于传统的B 树 LSM能够提供更高的写吞吐因为它不会出现任何的随机写 Append Only的操作保证了其只会顺序的写盘。

一个行存tablet上会存在一个memtable 和多个immutable memtable。数据更新都会写入到memtable中当memtable写满后会转变为immtable memtable immutable memtable会Flush成Key有序的SST Sorted String Table 文件 SST文件一旦生成则不能修改因此不会发生随机写的操作。SST文件在文件系统里面按层组织除了level 0上的SST文件间无序且存在overlap外其它level上的SST文件间有序且无overlap。因此查询的时候对于level 0上的文件需要逐个遍历而其它level的文件可以二分查找。底层的SST文件通过Compaction成新的SST文件去到更高层因此低层的数据要比高层的新所以一旦在某层上找到了满足条件的key则无需往更高层去查询。2 基于C 纯异步的开发

采用LSM对数据进行组织存储的系统并不仅仅只有Hologres LSM在谷歌的 BigTable 论文中被提出后很多的系统都对其进行了借鉴采用例如HBase。Hologres采用C 进行开发相较于Java native语言使得我们能够追求到更极致的性能。同时基于HOS Hologres Operation System 提供的异步接口进行纯异步开发 HOS通过抽象ExecutionContext来自我管理CPU的调度执行能够最大化的利用硬件资源、达到吞吐最大化。

3 IO优化与丰富的Cache机制

Hologres实现了非常丰富的Cache机制row cache、block cache、iterator cache、meta cache等来加速热数据的查找、减少IO访问、避免新内存分配。当无可避免的需要发生IO时 Hologres会对并发IO进行合并、通过wait/notice机制确保只访问一次IO 减少IO处理量。通过生成文件级别的词典及压缩减少文件物理存储成本及IO访问。

总结

Hologres致力于一站式实时数仓除了具备处理复杂OLAP分析场景的能力之外还支持超高QPS在线点查服务通过使用标准的Postgres SDK接口就能通过SQL获得低延时、高吞吐的在线服务能力简化学习成本提升开发效率。

作者周思华花名思召阿里巴巴技术专家现从事交互式分析引擎Hologres研发工作。

后续我们将会陆续推出有关Hologres的技术底层原理揭秘系列具体规划如下敬请持续关注

Hologres揭秘首次公开阿里巴巴云原生实时数仓核心技术揭秘Hologres揭秘首次揭秘云原生Hologres存储引擎Hologres揭秘深度解析高效率分布式查询引擎Hologres揭秘高性能原生加速MaxCompute核心原理Hologres揭秘优化COPY 批量导入性能提升5倍 Hologres揭秘如何支持超高QPS在线服务点查场景Hologres揭秘如何支持高吞吐UpsertHologres揭秘如何支持高并发查询Hologres揭秘如何支持高可用架构Hologres揭秘如何支持资源隔离支持多种负载Hologres揭秘向量检索引擎Proxima原理与使用实践Hologres揭秘读懂执行计划查询性能翻十倍Hologres揭秘分布式系统如何设计Shard与Table GroupHologres揭秘如何支持更多Postgres生态扩展包Hologres揭秘高吞吐写入Hologres的N种姿势......

感谢您的阅读也欢迎使用体验Hologres 可以参考使用手册同时也欢迎扫码加入钉群进行技术交流

holo公共云用户群.jpg

本文转自网络，原文链接：https://developer.aliyun.com/article/785647
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：阿里云产品精选内容合集（五）| 干货补给，你需要知道的数据库 下一篇：没有了

随机推荐

SSH密码方式登录Linux云服务器_云耀云服

操作场景本节操作介绍在Windows和Linux环境中使用SSH密码方式远程登录Linux云耀...
汇量科技云计算事业部负责人蔡超：站在云

云原生的话题近几年异常火热,2011年网景创始人马克安德森曾说,软件正在吞噬世界,...
【2021微信大数据挑战赛】常见问题之复赛

复赛参赛选手是只能通过使用 TI-ONE 平台完成比赛吗？是的，TI-ONE 是大赛官方...
为什么IT运营需要新的指标

在组织使用云计算基础设施为客户提供新的服务获利的时候，应该如何衡量IT运营的...
为什么每个人都应该使用Kaggle？

本文主要包含以下四大部分：介绍 Kaggle 好处总结介绍很多人在刚开始学习数...
TRTC Web端仿腾讯会议麦克风静音检测

项目背景目前 Web 的 TRTC 没有静音检测，在关闭麦克风的情况下发言没有提示，...
虚拟主机ip是共用的吗

虚拟主机 ip是共用的吗？一般来说，虚拟主机是资源共享，IP也是共用的。不过，除...
【日志服务CLS】初识 Nginx 日志服务～

????和尚虽然是移动端开发，但对于 Nginx 负载均衡稍稍有些了解，而曾经的毕业论...
阿里云李克：阿里云边缘云计算的技术和实

备受关注的2021全球分布式云大会·北京站于4月7日隆重召开，分布式云是2021年全...
干货|车来了APM应用性能体验实践

车来了是以大数据、人工智能技术为基础，通过连接人与车，提供智慧交通、城市公...

Hologres揭秘：如何支持超高QPS在线服务（点查）场景

推荐图文

SMC帮助伟东云教育节省90%迁云成本

中国信通院联合发布《上海“双千兆宽带城市”发展白

教你优雅的使用迭代器模式以及案例复盘

网络开发员养成记：如何设计一个自己的网站？

二维数组的地址分布究竟是什么样的？

dubbo-go v3 版本 go module 踩坑记

随机推荐

SSH密码方式登录Linux云服务器_云耀云服

汇量科技云计算事业部负责人蔡超：站在云

【2021微信大数据挑战赛】常见问题之复赛

为什么IT运营需要新的指标

为什么每个人都应该使用Kaggle？

TRTC Web端仿腾讯会议麦克风静音检测

虚拟主机ip是共用的吗

【日志服务CLS】初识 Nginx 日志服务～

阿里云李克：阿里云边缘云计算的技术和实

干货|车来了APM应用性能体验实践

关于我们