一、准备
在SQL Server 2005版本之后就有了表分区的概念与应用,在分区操作里面有一个叫做合并分区的功能,也被称为删除分区。分区所处的文件组和文件是不会被删除的,只会对数据进行转移合并。合并分区时需要注意所带来的IO问题。
合并分区常见情景:发现某个分区的数据很少,为了方便管理可以考虑合并分区。需要进行统计、四则运算的时候也可以考虑合并分区,这种情形下并没有对比合并与分区之间的性能,如果某位童鞋有兴趣和环境的话可以提供这方面的数据。
查看分区方案的方式:在SQL Server Management Studio中,选择数据库-->存储-->分区方案,右击分区方案名,在弹出的菜单中选择“编写分区方案脚本为”-->CREATE到-->新查询编辑器窗口。
二、测试
(一) 环境:使用RANGE RIGHT作为分区函数的关键字,它表示这个值开始是属于右边界的。
- RANGE RIGHT FOR VALUES ('20100101','20110101','20120101','20130101')
文件组 | 分区 | 取值范围 |
[FG1] | 1 | [ 过去某年, 2010 /01/01 ) |
[FG2] | 2 | [ 2010 /01/01 , 2011 /01/01 ) |
[FG3] | 3 | [ 2011 /01/01 , 2012 /01/01 ) |
[FG4] | 4 | [ 2012 /01/01 , 2013 /01/01 ) |
[PRIMARY] | 5 | [ 2013 /01/01 , 未来某年) |
1. 测试一:删除分区函数的第一个值
当使用MERGE RANGE ('20100101'),合并后分区就相当于:
- RANGE RIGHT FOR VALUES ('20110101','20120101','20130101')
文件组 | 分区 | 取值范围 |
[FG?] | 1 | [ 过去某年, 2011 /01/01 ) |
[FG3] | 2 | [ 2011 /01/01 , 2012 /01/01 ) |
[FG4] | 3 | [ 2012 /01/01 , 2013 /01/01 ) |
[PRIMARY] | 4 | [ 2013 /01/01 , 未来某年) |
问题:是[FG1]合并到[FG2],还是[FG2]合并到[FG1]呢?
测试结果:[FG2]合并到[FG1]
2. 测试二:删除分区函数的第二个值
当使用MERGE RANGE ('20110101'),合并后分区就相当于:
- RANGE RIGHT FOR VALUES ('20100101','20120101','20130101')
文件组 | 分区 | 取值范围 |
[FG1] | 1 | [ 过去某年, 2010 /01/01 ) |
[FG?] | 2 | [ 2010 /01/01 , 2012 /01/01 ) |
[FG4] | 3 | [ 2012 /01/01 , 2013 /01/01 ) |
[PRIMARY] | 4 | [ 2013 /01/01 , 未来某年) |
问题:是[FG2]合并到[FG3],还是[FG3]合并到[FG2]呢?
测试结果:[FG3]合并到[FG2]
3. 测试三:删除分区函数的最后一个值
当使用MERGE RANGE ('20130101'),合并后分区就相当于:
- RANGE RIGHT FOR VALUES ('20100101','20110101','20120101')
文件组 | 分区 | 取值范围 |
[FG1] | 1 | [ 过去某年, 2010 /01/01 ) |
[FG2] | 2 | [ 2010 /01/01 , 2011 /01/01 ) |
[FG3] | 3 | [ 2011 /01/01 , 2012 /01/01 ) |
[?] | 4 | [ 2012 /01/01 , 未来某年) |
问题:是[FG4]合并到[PRIMARY],还是[PRIMARY]合并到[FG4]呢?
测试结果:[PRIMARY]合并到[FG4]
(二) 环境:使用RANGELEFT作为分区函数的关键字,它表示这个值开始是属于左边界的。
- RANGE LEFT FOR VALUES ('20100101','20110101','20120101','20130101')
文件组 | 分区 | 取值范围 |
[FG1] | 1 | ( 过去某年, 2010 /01/01 ] |
[FG2] | 2 | ( 2010 /01/01 , 2011 /01/01 ] |
[FG3] | 3 | ( 2011 /01/01 , 2012 /01/01 ] |
[FG4] | 4 | ( 2012 /01/01 , 2013 /01/01 ] |
[PRIMARY] | 5 | ( 2013 /01/01 , 未来某年] |
1. 测试四:删除分区函数的第一个值
当使用MERGE RANGE ('20100101'),合并后分区就相当于:
- RANGE LEFT FOR VALUES ('20110101','20120101','20130101')
文件组 | 分区 | 取值范围 |
[FG?] | 1 | ( 过去某年, 2011 /01/01 ] |
[FG3] | 2 | ( 2011 /01/01 , 2012 /01/01 ] |
[FG4] | 3 | ( 2012 /01/01 , 2013 /01/01 ] |
[PRIMARY] | 4 | ( 2013 /01/01 , 未来某年] |
问题:是[FG1]合并到[FG2],还是[FG2]合并到[FG1]呢?
测试结果:[FG1]合并到[FG2]
2. 测试五:删除分区函数的第二个值
当使用MERGE RANGE ('20110101'),合并后分区就相当于:
- RANGE LEFT FOR VALUES ('20100101','20120101','20130101')
文件组 | 分区 | 取值范围 |
[FG1] | 1 | ( 过去某年, 2010 /01/01 ] |
[FG?] | 2 | ( 2010 /01/01 , 2012 /01/01 ] |
[FG4] | 3 | ( 2012 /01/01 , 2013 /01/01 ] |
[PRIMARY] | 4 | ( 2013 /01/01 , 未来某年] |
问题:是[FG2]合并到[FG3],还是[FG3]合并到[FG2]呢?
测试结果:[FG2]合并到[FG3]
3. 测试六:删除分区函数的最后一个值
当使用MERGE RANGE ('20130101'),合并后分区就相当于:
- RANGE LEFT FOR VALUES ('20100101','20110101','20120101')
文件组 | 分区 | 取值范围 |
[FG1] | 1 | ( 过去某年, 2010 /01/01 ] |
[FG2] | 2 | ( 2010 /01/01 , 2011 /01/01 ] |
[FG3] | 3 | ( 2011 /01/01 , 2012 /01/01 ] |
[?] | 4 | ( 2012 /01/01 , 未来某年] |
问题:是[FG4]合并到[PRIMARY],还是[PRIMARY]合并到[FG4]呢?
测试结果:[FG4]合并到[PRIMARY]
三、结论
下图中形象的表述了边界值(boundary_value)所处的分区,符号“()”表示不包含,“[]”表示包含,一个圆圈带叉图标表示需要删除这个边界值,当使用MERGE RANGE的时候,数据库就需要删除一个分区的数据,并把数据合并到另外一个分区中。你能从下图看出结论吗?
(图1:分区函数为右边界)
(图2:分区函数为左边界)
结论:删除的这个边界值(boundary_value)属于哪个分区,那么就会删除这个分区,再向邻近的分区合并。邻近的意思是以这个边界值为临界点的两个分区。图1与图2就很好的解释了这个结论。