当前位置：主页 > 查看内容

查询性能优化之Runtime Filter

发布时间：2021-05-06 00:00| 有位朋友查看

简介：作者柏锐在关系型数据库的查询中join是一个十分常见的操作通过将几个表关联起来用户可以在遵守数据库设计范式的前提下高效获得信息。在分析类查询中大表之间或大表与小表的 Join 通常使用 Hash Join 实现这通常也是查询的性能瓶颈之一因此如何优化j……

作者柏锐

在关系型数据库的查询中join是一个十分常见的操作通过将几个表关联起来用户可以在遵守数据库设计范式的前提下高效获得信息。在分析类查询中大表之间或大表与小表的 Join 通常使用 Hash Join 实现这通常也是查询的性能瓶颈之一因此如何优化join的查询性能也是计算引擎的重点。

Runtime Filter介绍

基本原理

Runtime Filter是[4]中提到的在数据库中广泛使用的一种优化技术其基本原理是通过在join的probe端提前过滤掉那些不会命中join的输入数据来大幅减少join中的数据传输和计算从而减少整体的执行时间。例如对于下面这条语句的原始执行计划如下其中sales是一个事实表 items是一个纬度表

SELECT * FROM sales JOIN items ON sales.item_id items.id WHERE items.price 100

如上图左半部分所示在进行join运算的时候不仅需要把全量的sales数据传输到join算子里去而且每一行sales数据都需要进行join运算包括算哈希值、比较运算等。这里如果items.price 100的选择率比较高比如达到50% 那么sales表中的大部分数据是肯定不会被join上如果提前进行过滤掉可以减少数据的传输和计算的开销。

上图的右半部分则是加入了runtime filter之后的执行计划从图中可以看到在进行join的build端拉取数据的过程中新增了一个RuntimeFilterBuilder的一个算子这个算子的作用就是在运行的过程中收集build端的信息形成runtime filter 并且发送到probe端的scan节点中去让probe端的节点可以在scan就减少输入的数据从而实现性能的提升。

Runtime Filter对Join Reorder的影响

在当前的大多数系统中runtime filter所需要的算子都是在优化器的CBO阶段之后插入进物理执行计划的使用的是一种基于规则的优化方法。然而在[3]中指出如果将runtime filter对执行计划所带来的影响在CBO阶段纳入考虑则能更进一步地优化执行计划。如下图是一个例子

在这个例子中图(a)是一个原始的查询需要对k mk和t三个表进行join。图(b)是在不考虑runtime filter的情况下进行CBO得到的物理执行计划。图(c)是在(b)的基础上通过基于规则的方式将runtime filter加入到物理执行计划中去。图(d)则是将runtime filter放在CBO阶段中得到的物理执行计划我们可以看到图(d)得到的最优的物理执行计划的最终cost小于图(c)得到的计划。

然而如果直接将runtime filter加入到CBO中去则会引起优化器的搜索空间的指数级增长。这是由于现有的优化器的CBO阶段大多基于动态规划的算法如果将runtime filter放入CBO中则子计划的最优解依赖于查询计划中父节点下推的filter的组合和runtime filter应用到的表的方式这种组合将会引起搜索空间的爆炸。[3]证明了对于星型查询和雪花查询即通过主键和外键将纬度表和事实表关联起来进行join的查询某些join顺序在加入runtime filter之后是等价的从而保证了优化器在CBO阶段搜索空间的线性增长。

PolarDB-X中的Runtime Filter

PolarDB-X作为一个HTAP数据库在满足高性能的oltp场景的同时也能实现对海量数据的高性能的分析场景。为满足客户大数据分析的需求我们也在自研的MPP引擎中实现了Runtime Filter。其基本原理与上述基本相同但是我们针对分布式数据库的场景也做了一些专门的优化。

Runtime Filter类型的选择

在PolarDB-X中我们选择使用bloom filter来过滤我们的数据。bloom filter有着诸多的优点

类型无关这一特性降低了我们处理多种类型的实现复杂度空间复杂度低能够提高传输效率和内存开销时间复杂度低这一时间复杂度既包括生成bloom filter的开销也指检查是否存在的时间开销较低的时间复杂度保证了不会引入过多的开销

当然在其他的系统中也会包含一些其他种类的过滤器比如在Spark SQL中如果碰到过滤的是分区列且build端的数据较小则会选择使用全量的输入数据进行动态分区的剪裁而如果查询的数据格式是parquet或者orc这样的带索引的格式则会生成min/max这样简单的过滤器来过滤。但这些过滤器大都针对特定场景不够通用。

Runtime Filter生成的代价估算

Runtime Filter的生成、传输和检查会引入额外的开销如果不加节制地滥用不但不会提升性能反而会导致性能的下降。由于代价估算和实现的复杂性大多数开源系统中都只支持在broadcast join中实现Runtime Filter 比如Trino 原Presto 中就是这样的。这个做法的好处是实现简单现有系统的改动较小但同时也会失去很多优化的机会。

在PolarDB-X中我们将Runtime Filter的生成规则与优化器的统计信息有效地结合通过多个纬度的数据来决定是否需要生成Runtime Filter

probe端的数据量的大小。如果probe端的数据量过小即便被过滤很多的数据其性能提升也无法弥补bloom filter的额外开销此时我们会放弃生成bloom filter。bloom filter的大小。bloom filter的大小由输入的数量和fpp 错误率决定并和输入的数量成正比。当bloom filter太大不仅会增大网络传输的数据也会增大内存占用因此我们将bloom filter的大小限制在一定范围内。过滤比例。当生成的bloom filter的过滤比例太小时将其下推到join的probe端不仅不会起到任何的效果而且精确的过滤比例的计算是一个比较复杂的过程这里我们使用一个近似的公式来估算过滤性

。只有当过滤比大于一定阀值时我们才会生成runtime filter。

Runtime Filter的执行

PolarDB-X中的MPP引擎是一个为交互式分析而生的分布式的计算引擎与Spark、Flink等不同的地方在于采用push的执行模型。这个模型的好处在于中间数据不用落盘极大地减小了计算过程中等待的延迟但也增加了Runtime Filter这一特性开发的复杂度。与大部分的开源计算引擎不同 PolarDB-X中的Runtime Filter不仅仅支持broadcast join 也同样支持其他各种分布式 join算法。我们仍然使用上面的一个SQL语句举例子

SELECT * FROM sales JOIN items ON sales.item_id items.id WHERE items.price 100

在开启了runtime filter之后的物理执行逻辑如下所示

如图所示 build端会将生成的bloom filter发送到coordinator coordinator在等待各个partition的bloom filter都发送完成之后进行一次merge操作将合并好的bloom filter发送到FilterExec算子中去从而实现过滤效果。通过coordinator合并之后的bloom filter的大小与单个的partition的bloom filter的大小一样大但为每个probe端只传输一次极大地减少了数据的传输。同时FilterExec在等待bloom filter的过程中并不会阻塞住而是通过异步的方式接收bloom filter 从而尽量减少 bloom filter生成给延迟带来的影响。

为了进一步减少数据的传输我们通过实现udf的方式将bloom filter下推到DN层在DN端进行数据的过滤从而大幅减少网络的开销。如下图所示 PolarDB-X会将bloom filter进一步下推至DN 减少了从DN拉取的数据量从而减少了网络传输和数据解析的开销。

效果评估

我们对比了Runtime Filter在 TPCH 100G的数据集上的效果其结果如下所示

我们可以看到对于耗时较长的大查询如Q9和Q21我们都取得了2 3倍的性能提升而对于其他中型的查询也有1倍的性能提升总体的性能提升在20%左右。

参考文献

Bloom filterDynamic Filtering in Trino Bitvector-aware Query Optimization for Decision Support Queries, SIGMOD 2020 Query Evaluation Techinques for Large Databases

【相关阅读】

快速掌握 PolarDB-X 拆分规则变更能力

子查询漫谈

探索 | PolarDB-X 实现高效灵活的分区管理

分布式数据库如何实现 Join

本文转自网络，原文链接：https://developer.aliyun.com/article/783908
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：Python遇到的坑--ValueError: check_hostname requires server_h 下一篇：NumPy之:结构化数组详解

随机推荐

新一代京东云自研服务器4月上线：性价比

云计算服务正在以前所未有的速度在各行各业快速普及，成为IT应用的最主流实现形...
注意这个数据科学错误，避免30多个小时的

本文转载自公众号读芯术(ID：AI_Discovery) 下面这个模型在一项图像识别竞赛中经...
2021年云原生趋势预测

【编者的话】本文作者利用自己云原生工程师的优势，分享了他对2021年及之后的云...
云服务器调整实例配置 - API 文档

1. 接口描述接口请求域名： cvm.tencentcloudapi.com 。本接口 (ResetInstance...
.top域名总量15强：80万注册量西部数码

据IDC评述网（idcps.com）报道，ntldstats.com最新数据显示，截止至2016年3月31...
支持Cloud-Init特性后，对使用弹性伸缩有

Cloud-init是开源的云初始化程序，能够对新创建弹性云服务器中指定的自定义信息...
三字母域名EXL.COM以35万元领跑sedo榜！

TOP云（west.cn）8月14日消息，本期的sedo 域名交易榜共有63个域名超2000美...
SSH密钥方式登录_弹性云服务器 ECS_用户

操作场景本节操作介绍在Windows和Linux环境中使用SSH密钥对方式远程登录Linux云...
618购物节全场IDC百度云产品享6.18折

每年618是年中购物节，每到这一天，大家都会进入网购模式，疯狂的买买买。618购...
阿里云盈利、亚马逊换帅：云计算走向分水

步入2月，美股新一轮财报季渐入高潮。本周二，包括阿里巴巴、亚马逊、谷歌在内...

查询性能优化之Runtime Filter

推荐图文

人民日报：套路多损害消费者利益维权难大数据“杀

云服务器查询地域列表 - API 文档

高德打车通用可编排订单状态机引擎设计

一文教你快速了解鸿蒙分布式调度并开发数据库相关应

【版本升级】腾讯云防火墙 2.1.0 版本正式发布！

使用新模板创建伸缩配置_弹性伸缩 AS_用户指南_伸缩

随机推荐

新一代京东云自研服务器4月上线：性价比

注意这个数据科学错误，避免30多个小时的

2021年云原生趋势预测

云服务器调整实例配置 - API 文档

.top域名总量15强：80万注册量西部数码

支持Cloud-Init特性后，对使用弹性伸缩有

三字母域名EXL.COM以35万元领跑sedo榜！

SSH密钥方式登录_弹性云服务器 ECS_用户

618购物节全场IDC百度云产品享6.18折

阿里云盈利、亚马逊换帅：云计算走向分水

关于我们