前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >BI-SQL丨IN & EXISTS

BI-SQL丨IN & EXISTS

原创
作者头像
PowerBI丨白茶
发布2022-03-05 15:31:24
2360
发布2022-03-05 15:31:24
举报
文章被收录于专栏:PowerBIPowerBI

IN &?EXISTS

IN和EXISTS,在子查询的过程中,二者可以说是SQL关键字中使用比较频繁的语句了,而且,在很多TA面试的时候,都会提问关于二者之间使用场景的区别。

之前在接触这部分知识点的时候,有的人说IN的性能更快,有的说EXISTS更快,其实这两种说法都不对,要看具体的应用场景的。

语法

IN子查询语法:

代码语言:txt
复制
SELECT 列名称(s) FROM 表来源
WHERE 列名称 IN ( SELECT 列名称(s) FROM 表来源...)

EXISTS子查询语法:

代码语言:txt
复制
SELECT 列名称(s) FROM 表来源 
WHERE EXISTS (SELECT 列名称(s) FROM 表名称 WHERE 表名称.KEY=表来源.KEY)

使用实例

案例数据:

在白茶本机的数据库中存在名为“CaseData”的数据库。

“Dim_Date“日期表、"Dim_Product"产品表、"Fact_Sales"销售事实表。

例子1:

查询产品表中,所有有销售事实的产品信息。

代码语言:txt
复制
SELECT * FROM Dim_Product
WHERE ProductID IN (SELECT ProductID FROM Fact_Sales)

结果如下:

那么这段语法的执行顺序是什么?

子查询→内外表笛卡儿积→筛选

首先执行的是内部的子查询,先查找出在Fact事实表中存在的产品ID。

其次,外部产品表的所有列和事实表的查询结果生成一个笛卡尔积。

最后,进行条件筛选,查找出产品表ProductID与事实表ProductID相等结果记录。

因此,使用IN进行子查询,内部的表(即事实表)数据越小,速度越快。

例子2:

使用EXISTS执行上面的操作。

代码语言:txt
复制
SELECT * FROM Dim_Product
WHERE EXISTS (SELECT ProductID FROM Fact_Sales WHERE Fact_Sales.ProductID=Dim_Product.ProductID)

结果如下:

EXISTS的执行顺序是这样的:

检测子查询的行→遍历循环外表→判断外表与子查询是否匹配

首先执行的是遍历循环外表(即产品表)。

然后判断外表(产品表)中的条件列是否与事实表中的条件列相匹配,如果匹配,则会出现在结果集中,否则不会出现在结果中。

因此,使用EXISTS进行查询的时候,通常是外表的数据越小,性能越快。

二者之间还是有一些其他小细节的区分,这里补充一下:IN不会对NULL(即空值)进行处理,而EXISTS是看内外条件是否相等,因此屏蔽了NULL。使用NOT IN的时候,对内外表都进行了扫描,没有使用索引;而NOT EXISTS子查询依然可以使用索引,因此,无论哪个表的数据量大,NOT EXISTS的性能都要比NOT IN要快。

这里是白茶,一个PowerBI的初学者。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com