mysql 5.6 分区表


一.分区表简介


mysql从5.1版本开始支持分区。每个分区的名称是不区分大小写,同个表中的分区名称要唯一,以下实例mysql5.6上测试通过。

mysql支持以下几种类型的分区:

1.RANGE 分区:


基于属于一个给定连续区间的列值,把多行分配给分区。



2.LIST 分区:


类似于按RANGE分区,区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择。



3.HASH分区:


基于用户定义的表达式的返回值来进行选择的分区,该表达式使用将要插入到表中的这些行的列值进行计算。这个函数可以包含MySQL中有效的、产生非负整数值的任何表达式。



4.KEY分区:

类似于按HASH分区,区别在于KEY分区只支持计算一列或多列,且MySQL服务器提供其自身的哈希函数。必须有一列或多列包含整数值。



5.复合分区:


基于RANGE/LIST 类型的分区表中每个分区的再次分割。子分区可以是 HASH/KEY 等类型。

二.分区表示例:

1.RANGE 分区:

CREATE TABLE t5(id INT,dt DATETIME NOT NULL
 )
 PARTITION BY RANGE (TO_DAYS(dt)) (
     PARTITION p0 VALUES LESS THAN (TO_DAYS('2014-01-01')),
     PARTITION p1 VALUES LESS THAN (TO_DAYS('2014-02-01')),
     PARTITION p2 VALUES LESS THAN (TO_DAYS('2014-03-01')),
     PARTITION p3 VALUES LESS THAN MAXVALUE);

注意range分区不能直接对日期型数据分区,所以要对分日期进行分区,需要变通一下,将日期转换成int型才行。

CREATE TABLE t5(id INT,dt DATETIME NOT NULL
)
PARTITION BY RANGE (dt) (
    PARTITION p0 VALUES LESS THAN ('2014-01-02'),
    PARTITION p1 VALUES LESS THAN ('2014-01-03'),
    PARTITION p2 VALUES LESS THAN ('2014-01-04'),
    PARTITION p3 VALUES LESS THAN MAXVALUE);

如果使用上面的语句,直接使用日期列进行分区,则会出现以下错误:

错误码: 1697
VALUES value for partition 'p0' must have type INT

 

2.LIST分区

CREATE TABLE t6
 (userid  INT NOT NULL ,
  usertype INT NOT NULL
 )
 PARTITION BY LIST(usertype)
 (
 PARTITION p1 VALUES IN  (1),
 PARTITION p2 VALUES IN  (2),
 PARTITION p3 VALUES IN  (3)
 );


3.HASH分区

HASH分区主要用来确保数据在预先确定数目的分区中平均分布。只需指定一个列值或表达式作为哈希列,然后指定分区数据即可。


CREATE TABLE t8 
 
 (userid  INT NOT NULL , 
 
  dt DATE 
 
 ) 
 
 PARTITION BY HASH(MONTH(dt))  
 
 PARTITIONS 6;


HASH分区有个问题,就是where条件是指定的一个范围的话,将会扫描所有分区,这就达不到使用分区表来减少扫描范围获得性能的提高的目的。尤其是使用达式作为分区关键字时,一定要注意类型,最好是数值型。

EXPLAIN PARTITIONS
SELECT COUNT(*) FROM t8 WHERE dt>'2013-08-01‘

以上语句就是扫描所有分区.


4.key分区

Key分区类型于HASH分区,HASH分区使用的用户定义的表达式,而KEY分区的哈希函数是由MySQL 服务器提供,这些函数是基于与PASSWORD()一样的运算法则。它与Hash分区主要的区别是,分区依据只能是一个或多个列名的一个列表。


CREATE TABLE t9 
 
(userid  INT NOT NULL , 
 
 dt DATE 
 
) 
 
PARTITION BY HASH(dt)  
 
PARTITIONS 6;


Key分区和HASH分区一样,有范围扫描的问题。

5.复合分区

1)RANGE - HASH(范围哈希)复合分区

CREATE TABLE t11
 (id INT NOT NULL ,
 dt DATE
 )
 PARTITION BY RANGE(id)
 SUBPARTITION BY HASH(YEAR(dt))
 SUBPARTITIONS 4
 (
 PARTITION p1 VALUES LESS THAN (100000),
 PARTITION p2 VALUES LESS THAN maxvalue
 );

2)RANGE- KEY复合分区

CREATE TABLE t12
 (id  INT NOT NULL ,
 dt DATE
 )
 PARTITION BY RANGE(id)
 SUBPARTITION BY KEY(dt)
 SUBPARTITIONS 4
 (
 PARTITION p1 VALUES LESS THAN (100000),
 PARTITION p2 VALUES LESS THAN maxvalue
 );

3)LIST - HASH复合分区

CREATE TABLE t13 (
 userid INT,
 usertype INT
 )
 PARTITION BY LIST (usertype)
 SUBPARTITION BY HASH(userid)
 SUBPARTITIONS 3
 (
 PARTITION p1 VALUES IN  (1),
 PARTITION p2 VALUES IN  (2),
 PARTITION p3 VALUES IN  (3)
 )
 ;

4)LIST - KEY 复合分区

CREATE TABLE t14 (
 userid INT,
 usertype INT
 )
 PARTITION BY LIST (usertype)
 SUBPARTITION BY KEY(userid)
 SUBPARTITIONS 3
 (
 PARTITION p1 VALUES IN  (1),
 PARTITION p2 VALUES IN  (2),
 PARTITION p3 VALUES IN  (3)
 )
 ;


三.分区表的管理操作

删除分区:
ALTER TABLE t5 DROP PARTITION p1;
不可以删除HASH或者KEY分区。
一次性删除多个分区:
ALTER TABLE emp DROP PARTITION p1,p2;


增加分区:


ALTER TABLE t6 ADD PARTITION (PARTITION p4 VALUES IN (4));



拆分分区:
Reorganizepartition关键字可以对表的部分分区或全部分区进行修改,并且不会丢失数据。分解前后分区的整体范围应该一致。

ALTER TABLE t5
 REORGANIZE PARTITION p3 INTO
 (PARTITION p3 VALUES LESS THAN (TO_DAYS('2014-01-05')),
 PARTITION p4 VALUES LESS THAN (TO_DAYS('2014-01-06')),
 PARTITION p5 VALUES LESS THAN MAXVALUE
 );


合并分区:

ALTER TABLE t5
 REORGANIZE PARTITION p3,p4 INTO
 (PARTITION p1 VALUES LESS THAN (TO_DAYS('2014-01-06'))
 );

重新定义分区表(数据会重新组织):

ALTER TABLE t5
 PARTITION BY RANGE (TO_DAYS(dt)) (
     PARTITION p0 VALUES LESS THAN (TO_DAYS('2014-01-01')),
     PARTITION p1 VALUES LESS THAN (TO_DAYS('2014-07-01')),
     PARTITION p2 VALUES LESS THAN MAXVALUE);


ALTER TABLE t8 PARTITION BY HASH(MONTH(dt)) PARTITIONS 4;


删除表的所有分区:

ALTER TABLE t5 REMOVE PARTITIONING;  #不会丢失数据,表分变成普通表

重建分区: 

这和先删除保存在分区中的所有记录,然后重新插入它们,具有同样的效果。它可用于整理分区碎片。
ALTER TABLE t5 REBUILD PARTITION p0, p1;

优化分区
如果从分区中删除了大量的行,或者对一个带有可变长度的行(也就是说,有VARCHAR,BLOB,或TEXT类型的列)作了许多修改,可以使用“ALTER TABLE ... OPTIMIZE PARTITION”来收回没有使用的空间,并整理分区数据文件的碎片。
ALTER TABLE t5 OPTIMIZE PARTITION p0, p1;

分析分区:
读取并保存分区的键分布。
ALTER TABLE t5 ANALYZE PARTITION p1;

修复分区:
修复损坏的分区。
ALTER TABLE t5 REPAIR PARTITION p0,p1;


检查分区:
ALTER TABLE t5 CHECK PARTITION all;

截断分区

ALTER TABLE t5 TRUNCATE PARTITION p1;

置换分区

将指定分区的记录置换到普通表中,普通表的定义应该与分区表相同,包括约束、索引等

ALTER TABLE t5 exchange PARTITION p0 WITH TABLE t15;

注意,这里是真正意义上的置换,如果普通表(t15)里存在记录,且这些记录全都符合将要置换的指定分区的分区条件(如t15的记录都符合分区表t5的p0分区的分区条件),则普通表的记录会被写入到指定分区(分区表t5的p0分区)中,而指定分区的记录置换到普通表中。

如果普通表中有不符合将要转换的指定分区的分区条件的记录存在,则会转换失败,具体示例见:

mysql5.6分区置换


mysql从5.1版本开始支持分区。每个分区的名称是不区分大小写,同个表中的分区名称要唯一,以下实例mysql5.6上测试通过。

mysql支持以下几种类型的分区:

1.RANGE 分区:


基于属于一个给定连续区间的列值,把多行分配给分区。



2.LIST 分区:


类似于按RANGE分区,区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择。



3.HASH分区:


基于用户定义的表达式的返回值来进行选择的分区,该表达式使用将要插入到表中的这些行的列值进行计算。这个函数可以包含MySQL中有效的、产生非负整数值的任何表达式。



4.KEY分区:

类似于按HASH分区,区别在于KEY分区只支持计算一列或多列,且MySQL服务器提供其自身的哈希函数。必须有一列或多列包含整数值。



5.复合分区:


基于RANGE/LIST 类型的分区表中每个分区的再次分割。子分区可以是 HASH/KEY 等类型。

二.分区表示例:

1.RANGE 分区:

CREATE TABLE t5(id INT,dt DATETIME NOT NULL
 )
 PARTITION BY RANGE (TO_DAYS(dt)) (
     PARTITION p0 VALUES LESS THAN (TO_DAYS('2014-01-01')),
     PARTITION p1 VALUES LESS THAN (TO_DAYS('2014-02-01')),
     PARTITION p2 VALUES LESS THAN (TO_DAYS('2014-03-01')),
     PARTITION p3 VALUES LESS THAN MAXVALUE);

注意range分区不能直接对日期型数据分区,所以要对分日期进行分区,需要变通一下,将日期转换成int型才行。

CREATE TABLE t5(id INT,dt DATETIME NOT NULL
)
PARTITION BY RANGE (dt) (
    PARTITION p0 VALUES LESS THAN ('2014-01-02'),
    PARTITION p1 VALUES LESS THAN ('2014-01-03'),
    PARTITION p2 VALUES LESS THAN ('2014-01-04'),
    PARTITION p3 VALUES LESS THAN MAXVALUE);

如果使用上面的语句,直接使用日期列进行分区,则会出现以下错误:

错误码: 1697
VALUES value for partition 'p0' must have type INT

 

2.LIST分区

CREATE TABLE t6
 (userid  INT NOT NULL ,
  usertype INT NOT NULL
 )
 PARTITION BY LIST(usertype)
 (
 PARTITION p1 VALUES IN  (1),
 PARTITION p2 VALUES IN  (2),
 PARTITION p3 VALUES IN  (3)
 );


3.HASH分区

HASH分区主要用来确保数据在预先确定数目的分区中平均分布。只需指定一个列值或表达式作为哈希列,然后指定分区数据即可。


CREATE TABLE t8 
 
 (userid  INT NOT NULL , 
 
  dt DATE 
 
 ) 
 
 PARTITION BY HASH(MONTH(dt))  
 
 PARTITIONS 6;


HASH分区有个问题,就是where条件是指定的一个范围的话,将会扫描所有分区,这就达不到使用分区表来减少扫描范围获得性能的提高的目的。尤其是使用达式作为分区关键字时,一定要注意类型,最好是数值型。

EXPLAIN PARTITIONS
SELECT COUNT(*) FROM t8 WHERE dt>'2013-08-01‘

以上语句就是扫描所有分区.


4.key分区

Key分区类型于HASH分区,HASH分区使用的用户定义的表达式,而KEY分区的哈希函数是由MySQL 服务器提供,这些函数是基于与PASSWORD()一样的运算法则。它与Hash分区主要的区别是,分区依据只能是一个或多个列名的一个列表。


CREATE TABLE t9 
 
(userid  INT NOT NULL , 
 
 dt DATE 
 
) 
 
PARTITION BY HASH(dt)  
 
PARTITIONS 6;


Key分区和HASH分区一样,有范围扫描的问题。

5.复合分区

1)RANGE - HASH(范围哈希)复合分区

CREATE TABLE t11
 (id INT NOT NULL ,
 dt DATE
 )
 PARTITION BY RANGE(id)
 SUBPARTITION BY HASH(YEAR(dt))
 SUBPARTITIONS 4
 (
 PARTITION p1 VALUES LESS THAN (100000),
 PARTITION p2 VALUES LESS THAN maxvalue
 );

2)RANGE- KEY复合分区

CREATE TABLE t12
 (id  INT NOT NULL ,
 dt DATE
 )
 PARTITION BY RANGE(id)
 SUBPARTITION BY KEY(dt)
 SUBPARTITIONS 4
 (
 PARTITION p1 VALUES LESS THAN (100000),
 PARTITION p2 VALUES LESS THAN maxvalue
 );

3)LIST - HASH复合分区

CREATE TABLE t13 (
 userid INT,
 usertype INT
 )
 PARTITION BY LIST (usertype)
 SUBPARTITION BY HASH(userid)
 SUBPARTITIONS 3
 (
 PARTITION p1 VALUES IN  (1),
 PARTITION p2 VALUES IN  (2),
 PARTITION p3 VALUES IN  (3)
 )
 ;

4)LIST - KEY 复合分区

CREATE TABLE t14 (
 userid INT,
 usertype INT
 )
 PARTITION BY LIST (usertype)
 SUBPARTITION BY KEY(userid)
 SUBPARTITIONS 3
 (
 PARTITION p1 VALUES IN  (1),
 PARTITION p2 VALUES IN  (2),
 PARTITION p3 VALUES IN  (3)
 )
 ;


三.分区表的管理操作

删除分区:
ALTER TABLE t5 DROP PARTITION p1;
不可以删除HASH或者KEY分区。
一次性删除多个分区:
ALTER TABLE emp DROP PARTITION p1,p2;


增加分区:

ALTER TABLE t6 ADD PARTITION (PARTITION p4 VALUES IN (4));


拆分分区:
Reorganizepartition关键字可以对表的部分分区或全部分区进行修改,并且不会丢失数据。分解前后分区的整体范围应该一致。

ALTER TABLE t5
 REORGANIZE PARTITION p3 INTO
 (PARTITION p3 VALUES LESS THAN (TO_DAYS('2014-01-05')),
 PARTITION p4 VALUES LESS THAN (TO_DAYS('2014-01-06')),
 PARTITION p5 VALUES LESS THAN MAXVALUE
 );


合并分区:

ALTER TABLE t5
 REORGANIZE PARTITION p3,p4 INTO
 (PARTITION p1 VALUES LESS THAN (TO_DAYS('2014-01-06'))
 );


重新定义分区表(数据会重新组织):

删除表的所有分区:

ALTER TABLE t5
 PARTITION BY RANGE (TO_DAYS(dt)) (
     PARTITION p0 VALUES LESS THAN (TO_DAYS('2014-01-01')),
     PARTITION p1 VALUES LESS THAN (TO_DAYS('2014-07-01')),
     PARTITION p2 VALUES LESS THAN MAXVALUE);
     
 ALTER TABLE t8 PARTITION BY HASH(MONTH(dt)) PARTITIONS 4;

ALTER TABLE t5 REMOVE PARTITIONING;  #不会丢失数据,表分变成普通表

重建分区: 

这和先删除保存在分区中的所有记录,然后重新插入它们,具有同样的效果。它可用于整理分区碎片。
ALTER TABLE t5 REBUILD PARTITION p0, p1;

优化分区
如果从分区中删除了大量的行,或者对一个带有可变长度的行(也就是说,有VARCHAR,BLOB,或TEXT类型的列)作了许多修改,可以使用“ALTER TABLE ... OPTIMIZE PARTITION”来收回没有使用的空间,并整理分区数据文件的碎片。
ALTER TABLE t5 OPTIMIZE PARTITION p0, p1;

分析分区:
读取并保存分区的键分布。
ALTER TABLE t5 ANALYZE PARTITION p1;

修复分区:
修复损坏的分区。
ALTER TABLE t5 REPAIR PARTITION p0,p1;


检查分区:
ALTER TABLE t5 CHECK PARTITION all;

截断分区

ALTER TABLE t5 TRUNCATE PARTITION p1;

置换分区

将指定分区的记录置换到普通表中,普通表的定义应该与分区表相同,包括约束、索引等

ALTER TABLE t5 exchange PARTITION p0 WITH TABLE t15;

注意,这里是真正意义上的置换,如果普通表(t15)里存在记录,且这些记录全都符合将要置换的指定分区的分区条件(如t15的记录都符合分区表t5的p0分区的分区条件),则普通表的记录会被写入到指定分区(分区表t5的p0分区)中,而指定分区的记录置换到普通表中。

如果普通表中有不符合将要转换的指定分区的分区条件的记录存在,则会转换失败,具体示例见:

mysql5.6分区置换