mysql 5.6 分区表
一.分区表简介
mysql从5.1版本开始支持分区。每个分区的名称是不区分大小写,同个表中的分区名称要唯一,以下实例mysql5.6上测试通过。
mysql支持以下几种类型的分区:
1.RANGE 分区:
基于属于一个给定连续区间的列值,把多行分配给分区。
2.LIST 分区:
类似于按RANGE分区,区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择。
3.HASH分区:
基于用户定义的表达式的返回值来进行选择的分区,该表达式使用将要插入到表中的这些行的列值进行计算。这个函数可以包含MySQL中有效的、产生非负整数值的任何表达式。
4.KEY分区:
类似于按HASH分区,区别在于KEY分区只支持计算一列或多列,且MySQL服务器提供其自身的哈希函数。必须有一列或多列包含整数值。
5.复合分区:
基于RANGE/LIST 类型的分区表中每个分区的再次分割。子分区可以是 HASH/KEY 等类型。
二.分区表示例:
1.RANGE 分区:
CREATE TABLE t5(id INT,dt DATETIME NOT NULL
)
PARTITION BY RANGE (TO_DAYS(dt)) (
PARTITION p0 VALUES LESS THAN (TO_DAYS('2014-01-01')),
PARTITION p1 VALUES LESS THAN (TO_DAYS('2014-02-01')),
PARTITION p2 VALUES LESS THAN (TO_DAYS('2014-03-01')),
PARTITION p3 VALUES LESS THAN MAXVALUE);
注意range分区不能直接对日期型数据分区,所以要对分日期进行分区,需要变通一下,将日期转换成int型才行。
CREATE TABLE t5(id INT,dt DATETIME NOT NULL
)
PARTITION BY RANGE (dt) (
PARTITION p0 VALUES LESS THAN ('2014-01-02'),
PARTITION p1 VALUES LESS THAN ('2014-01-03'),
PARTITION p2 VALUES LESS THAN ('2014-01-04'),
PARTITION p3 VALUES LESS THAN MAXVALUE);
如果使用上面的语句,直接使用日期列进行分区,则会出现以下错误:
错误码: 1697
VALUES value for partition 'p0' must have type INT
2.LIST分区
CREATE TABLE t6
(userid INT NOT NULL ,
usertype INT NOT NULL
)
PARTITION BY LIST(usertype)
(
PARTITION p1 VALUES IN (1),
PARTITION p2 VALUES IN (2),
PARTITION p3 VALUES IN (3)
);
3.HASH分区
HASH分区主要用来确保数据在预先确定数目的分区中平均分布。只需指定一个列值或表达式作为哈希列,然后指定分区数据即可。
CREATE TABLE t8
(userid INT NOT NULL ,
dt DATE
)
PARTITION BY HASH(MONTH(dt))
PARTITIONS 6;
HASH分区有个问题,就是where条件是指定的一个范围的话,将会扫描所有分区,这就达不到使用分区表来减少扫描范围获得性能的提高的目的。尤其是使用达式作为分区关键字时,一定要注意类型,最好是数值型。
EXPLAIN PARTITIONS
SELECT COUNT(*) FROM t8 WHERE dt>'2013-08-01‘
以上语句就是扫描所有分区.
4.key分区
Key分区类型于HASH分区,HASH分区使用的用户定义的表达式,而KEY分区的哈希函数是由MySQL 服务器提供,这些函数是基于与PASSWORD()一样的运算法则。它与Hash分区主要的区别是,分区依据只能是一个或多个列名的一个列表。
CREATE TABLE t9
(userid INT NOT NULL ,
dt DATE
)
PARTITION BY HASH(dt)
PARTITIONS 6;
Key分区和HASH分区一样,有范围扫描的问题。
5.复合分区
1)RANGE - HASH(范围哈希)复合分区
CREATE TABLE t11
(id INT NOT NULL ,
dt DATE
)
PARTITION BY RANGE(id)
SUBPARTITION BY HASH(YEAR(dt))
SUBPARTITIONS 4
(
PARTITION p1 VALUES LESS THAN (100000),
PARTITION p2 VALUES LESS THAN maxvalue
);
2)RANGE- KEY复合分区
CREATE TABLE t12
(id INT NOT NULL ,
dt DATE
)
PARTITION BY RANGE(id)
SUBPARTITION BY KEY(dt)
SUBPARTITIONS 4
(
PARTITION p1 VALUES LESS THAN (100000),
PARTITION p2 VALUES LESS THAN maxvalue
);
3)LIST - HASH复合分区
CREATE TABLE t13 (
userid INT,
usertype INT
)
PARTITION BY LIST (usertype)
SUBPARTITION BY HASH(userid)
SUBPARTITIONS 3
(
PARTITION p1 VALUES IN (1),
PARTITION p2 VALUES IN (2),
PARTITION p3 VALUES IN (3)
)
;
4)LIST - KEY 复合分区
CREATE TABLE t14 (
userid INT,
usertype INT
)
PARTITION BY LIST (usertype)
SUBPARTITION BY KEY(userid)
SUBPARTITIONS 3
(
PARTITION p1 VALUES IN (1),
PARTITION p2 VALUES IN (2),
PARTITION p3 VALUES IN (3)
)
;
三.分区表的管理操作
删除分区:
ALTER TABLE t5 DROP PARTITION p1;
不可以删除HASH或者KEY分区。
一次性删除多个分区:
ALTER TABLE emp DROP PARTITION p1,p2;
增加分区:
ALTER TABLE t6 ADD PARTITION (PARTITION p4 VALUES IN (4));
拆分分区:
Reorganizepartition关键字可以对表的部分分区或全部分区进行修改,并且不会丢失数据。分解前后分区的整体范围应该一致。
ALTER TABLE t5
REORGANIZE PARTITION p3 INTO
(PARTITION p3 VALUES LESS THAN (TO_DAYS('2014-01-05')),
PARTITION p4 VALUES LESS THAN (TO_DAYS('2014-01-06')),
PARTITION p5 VALUES LESS THAN MAXVALUE
);
合并分区:
ALTER TABLE t5
REORGANIZE PARTITION p3,p4 INTO
(PARTITION p1 VALUES LESS THAN (TO_DAYS('2014-01-06'))
);
重新定义分区表(数据会重新组织):
ALTER TABLE t5
PARTITION BY RANGE (TO_DAYS(dt)) (
PARTITION p0 VALUES LESS THAN (TO_DAYS('2014-01-01')),
PARTITION p1 VALUES LESS THAN (TO_DAYS('2014-07-01')),
PARTITION p2 VALUES LESS THAN MAXVALUE);
ALTER TABLE t8 PARTITION BY HASH(MONTH(dt)) PARTITIONS 4;
删除表的所有分区:
ALTER TABLE t5 REMOVE PARTITIONING; #不会丢失数据,表分变成普通表
重建分区:
这和先删除保存在分区中的所有记录,然后重新插入它们,具有同样的效果。它可用于整理分区碎片。
ALTER TABLE t5 REBUILD PARTITION p0, p1;
优化分区:
如果从分区中删除了大量的行,或者对一个带有可变长度的行(也就是说,有VARCHAR,BLOB,或TEXT类型的列)作了许多修改,可以使用“ALTER TABLE ... OPTIMIZE PARTITION”来收回没有使用的空间,并整理分区数据文件的碎片。
ALTER TABLE t5 OPTIMIZE PARTITION p0, p1;
分析分区:
读取并保存分区的键分布。
ALTER TABLE t5 ANALYZE PARTITION p1;
修复分区:
修复损坏的分区。
ALTER TABLE t5 REPAIR PARTITION p0,p1;
检查分区:
ALTER TABLE t5 CHECK PARTITION all;
截断分区
ALTER TABLE t5 TRUNCATE PARTITION p1;
置换分区
将指定分区的记录置换到普通表中,普通表的定义应该与分区表相同,包括约束、索引等
ALTER TABLE t5 exchange PARTITION p0 WITH TABLE t15;
注意,这里是真正意义上的置换,如果普通表(t15)里存在记录,且这些记录全都符合将要置换的指定分区的分区条件(如t15的记录都符合分区表t5的p0分区的分区条件),则普通表的记录会被写入到指定分区(分区表t5的p0分区)中,而指定分区的记录置换到普通表中。
如果普通表中有不符合将要转换的指定分区的分区条件的记录存在,则会转换失败,具体示例见:
mysql5.6分区置换
mysql从5.1版本开始支持分区。每个分区的名称是不区分大小写,同个表中的分区名称要唯一,以下实例mysql5.6上测试通过。
mysql支持以下几种类型的分区:
1.RANGE 分区:
基于属于一个给定连续区间的列值,把多行分配给分区。
2.LIST 分区:
类似于按RANGE分区,区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择。
3.HASH分区:
基于用户定义的表达式的返回值来进行选择的分区,该表达式使用将要插入到表中的这些行的列值进行计算。这个函数可以包含MySQL中有效的、产生非负整数值的任何表达式。
4.KEY分区:
类似于按HASH分区,区别在于KEY分区只支持计算一列或多列,且MySQL服务器提供其自身的哈希函数。必须有一列或多列包含整数值。
5.复合分区:
基于RANGE/LIST 类型的分区表中每个分区的再次分割。子分区可以是 HASH/KEY 等类型。
二.分区表示例:
1.RANGE 分区:
CREATE TABLE t5(id INT,dt DATETIME NOT NULL
)
PARTITION BY RANGE (TO_DAYS(dt)) (
PARTITION p0 VALUES LESS THAN (TO_DAYS('2014-01-01')),
PARTITION p1 VALUES LESS THAN (TO_DAYS('2014-02-01')),
PARTITION p2 VALUES LESS THAN (TO_DAYS('2014-03-01')),
PARTITION p3 VALUES LESS THAN MAXVALUE);
注意range分区不能直接对日期型数据分区,所以要对分日期进行分区,需要变通一下,将日期转换成int型才行。
CREATE TABLE t5(id INT,dt DATETIME NOT NULL
)
PARTITION BY RANGE (dt) (
PARTITION p0 VALUES LESS THAN ('2014-01-02'),
PARTITION p1 VALUES LESS THAN ('2014-01-03'),
PARTITION p2 VALUES LESS THAN ('2014-01-04'),
PARTITION p3 VALUES LESS THAN MAXVALUE);
如果使用上面的语句,直接使用日期列进行分区,则会出现以下错误:
错误码: 1697
VALUES value for partition 'p0' must have type INT
2.LIST分区
CREATE TABLE t6
(userid INT NOT NULL ,
usertype INT NOT NULL
)
PARTITION BY LIST(usertype)
(
PARTITION p1 VALUES IN (1),
PARTITION p2 VALUES IN (2),
PARTITION p3 VALUES IN (3)
);
3.HASH分区
HASH分区主要用来确保数据在预先确定数目的分区中平均分布。只需指定一个列值或表达式作为哈希列,然后指定分区数据即可。
CREATE TABLE t8
(userid INT NOT NULL ,
dt DATE
)
PARTITION BY HASH(MONTH(dt))
PARTITIONS 6;
HASH分区有个问题,就是where条件是指定的一个范围的话,将会扫描所有分区,这就达不到使用分区表来减少扫描范围获得性能的提高的目的。尤其是使用达式作为分区关键字时,一定要注意类型,最好是数值型。
EXPLAIN PARTITIONS
SELECT COUNT(*) FROM t8 WHERE dt>'2013-08-01‘
以上语句就是扫描所有分区.
4.key分区
Key分区类型于HASH分区,HASH分区使用的用户定义的表达式,而KEY分区的哈希函数是由MySQL 服务器提供,这些函数是基于与PASSWORD()一样的运算法则。它与Hash分区主要的区别是,分区依据只能是一个或多个列名的一个列表。
CREATE TABLE t9
(userid INT NOT NULL ,
dt DATE
)
PARTITION BY HASH(dt)
PARTITIONS 6;
Key分区和HASH分区一样,有范围扫描的问题。
5.复合分区
1)RANGE - HASH(范围哈希)复合分区
CREATE TABLE t11
(id INT NOT NULL ,
dt DATE
)
PARTITION BY RANGE(id)
SUBPARTITION BY HASH(YEAR(dt))
SUBPARTITIONS 4
(
PARTITION p1 VALUES LESS THAN (100000),
PARTITION p2 VALUES LESS THAN maxvalue
);
2)RANGE- KEY复合分区
CREATE TABLE t12
(id INT NOT NULL ,
dt DATE
)
PARTITION BY RANGE(id)
SUBPARTITION BY KEY(dt)
SUBPARTITIONS 4
(
PARTITION p1 VALUES LESS THAN (100000),
PARTITION p2 VALUES LESS THAN maxvalue
);
3)LIST - HASH复合分区
CREATE TABLE t13 (
userid INT,
usertype INT
)
PARTITION BY LIST (usertype)
SUBPARTITION BY HASH(userid)
SUBPARTITIONS 3
(
PARTITION p1 VALUES IN (1),
PARTITION p2 VALUES IN (2),
PARTITION p3 VALUES IN (3)
)
;
4)LIST - KEY 复合分区
CREATE TABLE t14 (
userid INT,
usertype INT
)
PARTITION BY LIST (usertype)
SUBPARTITION BY KEY(userid)
SUBPARTITIONS 3
(
PARTITION p1 VALUES IN (1),
PARTITION p2 VALUES IN (2),
PARTITION p3 VALUES IN (3)
)
;
三.分区表的管理操作
删除分区:
ALTER TABLE t5 DROP PARTITION p1;
不可以删除HASH或者KEY分区。
一次性删除多个分区:
ALTER TABLE emp DROP PARTITION p1,p2;
增加分区:
ALTER TABLE t6 ADD PARTITION (PARTITION p4 VALUES IN (4));
拆分分区:
Reorganizepartition关键字可以对表的部分分区或全部分区进行修改,并且不会丢失数据。分解前后分区的整体范围应该一致。
ALTER TABLE t5
REORGANIZE PARTITION p3 INTO
(PARTITION p3 VALUES LESS THAN (TO_DAYS('2014-01-05')),
PARTITION p4 VALUES LESS THAN (TO_DAYS('2014-01-06')),
PARTITION p5 VALUES LESS THAN MAXVALUE
);
合并分区:
ALTER TABLE t5
REORGANIZE PARTITION p3,p4 INTO
(PARTITION p1 VALUES LESS THAN (TO_DAYS('2014-01-06'))
);
重新定义分区表(数据会重新组织):
删除表的所有分区:
ALTER TABLE t5
PARTITION BY RANGE (TO_DAYS(dt)) (
PARTITION p0 VALUES LESS THAN (TO_DAYS('2014-01-01')),
PARTITION p1 VALUES LESS THAN (TO_DAYS('2014-07-01')),
PARTITION p2 VALUES LESS THAN MAXVALUE);
ALTER TABLE t8 PARTITION BY HASH(MONTH(dt)) PARTITIONS 4;
ALTER TABLE t5 REMOVE PARTITIONING; #不会丢失数据,表分变成普通表
重建分区:
这和先删除保存在分区中的所有记录,然后重新插入它们,具有同样的效果。它可用于整理分区碎片。
ALTER TABLE t5 REBUILD PARTITION p0, p1;
优化分区:
如果从分区中删除了大量的行,或者对一个带有可变长度的行(也就是说,有VARCHAR,BLOB,或TEXT类型的列)作了许多修改,可以使用“ALTER TABLE ... OPTIMIZE PARTITION”来收回没有使用的空间,并整理分区数据文件的碎片。
ALTER TABLE t5 OPTIMIZE PARTITION p0, p1;
分析分区:
读取并保存分区的键分布。
ALTER TABLE t5 ANALYZE PARTITION p1;
修复分区:
修复损坏的分区。
ALTER TABLE t5 REPAIR PARTITION p0,p1;
检查分区:
ALTER TABLE t5 CHECK PARTITION all;
截断分区
ALTER TABLE t5 TRUNCATE PARTITION p1;
置换分区
将指定分区的记录置换到普通表中,普通表的定义应该与分区表相同,包括约束、索引等
ALTER TABLE t5 exchange PARTITION p0 WITH TABLE t15;
注意,这里是真正意义上的置换,如果普通表(t15)里存在记录,且这些记录全都符合将要置换的指定分区的分区条件(如t15的记录都符合分区表t5的p0分区的分区条件),则普通表的记录会被写入到指定分区(分区表t5的p0分区)中,而指定分区的记录置换到普通表中。
如果普通表中有不符合将要转换的指定分区的分区条件的记录存在,则会转换失败,具体示例见:
mysql5.6分区置换