前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >MySQL分区表对NULL值的处理

MySQL分区表对NULL值的处理

作者头像
老叶茶馆
发布2023-02-18 17:40:54
1.4K0
发布2023-02-18 17:40:54
举报

1.概述

MySQL的分区表没有禁止NULL值作为分区表达式的值,无论它是列值还是用户提供的表达式的值,需要记住NULL值不是数字。MySQL的分区实现中将NULL视为小于任何非NULL值,与order by类似。

2.range分区表处理NULL

1.创建range分区表

代码语言:javascript
复制
CREATE TABLE t_range (
c1 INT,
c2 VARCHAR(20)
)
PARTITION BY RANGE(c1) (
  PARTITION p0 VALUES LESS THAN (0),
  PARTITION p1 VALUES LESS THAN (10),
  PARTITION p2 VALUES LESS THAN MAXVALUE
);

2.插入2条分区列为null值的数据

代码语言:javascript
复制
insert into t_range values (NULL,'a'),(NULL,'b');

3.查看数据的分布情况

代码语言:javascript
复制
mysql> SELECT TABLE_NAME, PARTITION_NAME, TABLE_ROWS, AVG_ROW_LENGTH, DATA_LENGTH
FROM INFORMATION_SCHEMA.PARTITIONS
WHERE TABLE_SCHEMA = 'test1' AND TABLE_NAME = 't_range';
+------------+----------------+------------+----------------+-------------+
| TABLE_NAME | PARTITION_NAME | TABLE_ROWS | AVG_ROW_LENGTH | DATA_LENGTH |
+------------+----------------+------------+----------------+-------------+
| t_range    | p0             |          2 |           8192 |       16384 |
| t_range    | p1             |          0 |              0 |       16384 |
| t_range    | p2             |          0 |              0 |       16384 |
+------------+----------------+------------+----------------+-------------+
3 rows in set (0.01 sec)

mysql> select * from t_range partition(p0);
+------+------+
| c1   | c2   |
+------+------+
| NULL | a    |
| NULL | b    |
+------+------+
2 rows in set (0.00 sec)

可以看到分区列包含null值的2条数据都分布在p0分区上。

3.list分区表处理NULL

1.创建2张list分区表,t_list1分区列包含null值,t_list2分区列中不包含null值

代码语言:javascript
复制
CREATE TABLE t_list1 (
c1 INT,
c2 VARCHAR(20)
)
PARTITION BY LIST(c1) (
    PARTITION p0 VALUES IN (0, 3, 6),
    PARTITION p1 VALUES IN (1, 4, 7),
    PARTITION p2 VALUES IN (2, 5, 8),
    PARTITION p3 VALUES IN (NULL)
);

CREATE TABLE t_list2 (
c1 INT,
c2 VARCHAR(20)
)
PARTITION BY LIST(c1) (
    PARTITION p0 VALUES IN (0, 3, 6),
    PARTITION p1 VALUES IN (1, 4, 7),
    PARTITION p2 VALUES IN (2, 5, 8)
);

2.分别向2张表中插入2条分区列为null值的数据

代码语言:javascript
复制
mysql> insert into t_list1 values (NULL,'a'),(NULL,'b');
Query OK, 2 rows affected (0.01 sec)
Records: 2  Duplicates: 0  Warnings: 0

mysql> insert into t_list2 values (NULL,'a'),(NULL,'b');
ERROR 1526 (HY000): Table has no partition for value NULL

可以看到 t_list2 表的分区列中不包含null值,所以数据插入失败。

3.查看数据的分布情况

代码语言:javascript
复制
mysql> SELECT TABLE_NAME, PARTITION_NAME, TABLE_ROWS, AVG_ROW_LENGTH, DATA_LENGTH
FROM INFORMATION_SCHEMA.PARTITIONS
WHERE TABLE_SCHEMA = 'test1' AND TABLE_NAME = 't_list1';
+------------+----------------+------------+----------------+-------------+
| TABLE_NAME | PARTITION_NAME | TABLE_ROWS | AVG_ROW_LENGTH | DATA_LENGTH |
+------------+----------------+------------+----------------+-------------+
| t_list1    | p0             |          0 |              0 |       16384 |
| t_list1    | p1             |          0 |              0 |       16384 |
| t_list1    | p2             |          0 |              0 |       16384 |
| t_list1    | p3             |          2 |           8192 |       16384 |
+------------+----------------+------------+----------------+-------------+
4 rows in set (0.00 sec)

可以看到 t_list1 表中插入的2条包含null值的数据,由于p3分区包含null值列,所以2条数据分布在p3分区中。

4.hash/key分区表处理NULL

1.创建2张测试表,一张hash分区表,一张key分区表

代码语言:javascript
复制
CREATE TABLE t_hash (
c1 INT,
c2 VARCHAR(20)
)
PARTITION BY HASH(c1)
PARTITIONS 2;

CREATE TABLE t_key (
c1 INT,
c2 VARCHAR(20)
)
PARTITION BY key(c1)
PARTITIONS 2;

2.分别向2张表中插入3条数据

代码语言:javascript
复制
mysql> insert into t_hash values (NULL,'a'),(0,'b'),(1,'c');
Query OK, 3 rows affected (0.00 sec)
Records: 3  Duplicates: 0  Warnings: 0

mysql> insert into t_key values (NULL,'a'),(0,'b'),(1,'c');
Query OK, 3 rows affected (0.01 sec)
Records: 3  Duplicates: 0  Warnings: 0

3.查看数据的分布情况

代码语言:javascript
复制
mysql> SELECT TABLE_NAME,PARTITION_NAME,TABLE_ROWS,AVG_ROW_LENGTH,DATA_LENGTH 
FROM INFORMATION_SCHEMA.PARTITIONS 
WHERE TABLE_SCHEMA = 'test1' AND TABLE_NAME in ('t_hash','t_key');
+------------+----------------+------------+----------------+-------------+
| TABLE_NAME | PARTITION_NAME | TABLE_ROWS | AVG_ROW_LENGTH | DATA_LENGTH |
+------------+----------------+------------+----------------+-------------+
| t_hash     | p0             |          2 |           8192 |       16384 |
| t_hash     | p1             |          1 |          16384 |       16384 |
| t_key      | p0             |          2 |           8192 |       16384 |
| t_key      | p1             |          1 |          16384 |       16384 |
+------------+----------------+------------+----------------+-------------+
4 rows in set (0.00 sec)

mysql> select * from t_hash partition(p0);
+------+------+
| c1   | c2   |
+------+------+
| NULL | a    |
|    0 | b    |
+------+------+
2 rows in set (0.00 sec)

mysql> select * from t_key partition(p0);
+------+------+
| c1   | c2   |
+------+------+
| NULL | a    |
|    1 | c    |
+------+------+
2 rows in set (0.00 sec)

可以看到分区列中包含null值的记录都在p0分区。

4.如果我们增加hash/key分区表的分区数,分区列为null值的记录会分布到其他分区

代码语言:javascript
复制
# 创建hash/key分区表,分区数为3
CREATE TABLE t_hash1 (
c1 INT,
c2 VARCHAR(20)
)
PARTITION BY HASH(c1)
PARTITIONS 3;

CREATE TABLE t_key1 (
c1 INT,
c2 VARCHAR(20)
)
PARTITION BY key(c1)
PARTITIONS 3;


# 插入数据
insert into t_hash1 values (NULL,'a'),(0,'b'),(1,'c');
insert into t_key1 values (NULL,'a'),(0,'b'),(1,'c');


# 查看数据的分布情况
mysql> SELECT TABLE_NAME,PARTITION_NAME,TABLE_ROWS,AVG_ROW_LENGTH,DATA_LENGTH 
FROM INFORMATION_SCHEMA.PARTITIONS 
WHERE TABLE_SCHEMA = 'test1' AND TABLE_NAME in ('t_hash1','t_key1');
+------------+----------------+------------+----------------+-------------+
| TABLE_NAME | PARTITION_NAME | TABLE_ROWS | AVG_ROW_LENGTH | DATA_LENGTH |
+------------+----------------+------------+----------------+-------------+
| t_hash1    | p0             |          1 |          16384 |       16384 |
| t_hash1    | p1             |          1 |          16384 |       16384 |
| t_hash1    | p2             |          1 |          16384 |       16384 |
| t_key1     | p0             |          0 |              0 |       16384 |
| t_key1     | p1             |          2 |           8192 |       16384 |
| t_key1     | p2             |          1 |          16384 |       16384 |
+------------+----------------+------------+----------------+-------------+
6 rows in set (0.00 sec)

mysql> select * from t_hash1 partition(p2);
+------+------+
| c1   | c2   |
+------+------+
| NULL | a    |
+------+------+
1 row in set (0.00 sec)

mysql> select * from t_key1 partition(p2);
+------+------+
| c1   | c2   |
+------+------+
| NULL | a    |
+------+------+
1 row in set (0.00 sec)

可以看到,当hash/key分区表的分区数为3时,分区列为null值的记录分布在了p2分区。

5.总结

range分区表:如果插入记录的分区列值为NULL,则将该行记录插入到最小的分区中。

list分区表:对NULL值的处理有2种方式:

(1)当且仅当只有一个分区使用包含NULL的值做分区表达式时(例如:PARTITION p3 VALUES IN (NULL)),允许插入分区列为NULL的值。

(2)当表中没有显示使用包含NULL的值做分区表达式时,会拒绝插入分区列为NULL的值。

hash/key分区表:对NULL的处理略有不同,不同的分区数,会导致分区列为NULL值的记录分布到不同的分区。

Enjoy GreatSQL :)


本文参与?腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-02-12,如有侵权请联系?cloudcommunity@tencent.com 删除

本文分享自 老叶茶馆 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与?腾讯云自媒体分享计划? ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.概述
  • 2.range分区表处理NULL
  • 3.list分区表处理NULL
  • 4.hash/key分区表处理NULL
  • 5.总结
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com