透视转换
透视数据是一种把数据从行的状态旋转为列的状态的处理。每个透视转换将涉及分组、扩展及聚合三个逻辑处理阶段,每个阶段都有相关的元素:分组阶段处理相关的分组或行元素,扩展阶段处理相关的扩展或列元素,聚合阶段处理相关的聚合元素和聚合函数。现在假设有一张表数据如下:
我现在需要查询出下面的结果:
需求分析:需要在结果中为每一个雇员生成一行记录,这就需要对Orders表中的行按照其empid列进行分组;从结果看,还需要为每一个客户生成一个不同的结果列,那么扩展元素就是custid列;最后还需要对数据进行聚合(本例中为SUM)。以下代码是使用标准SQL进行透视转换:
SELECT empid,
SUM(CASE WHEN custid = 'A' THEN qty END) AS A,
SUM(CASE WHEN custid = 'B' THEN qty END) AS B,
SUM(CASE WHEN custid = 'C' THEN qty END) AS C,
SUM(CASE WHEN custid = 'D' THEN qty END) AS D
FROM dbo.Orders
GROUP BY empid;
※※※※※※ 补充,如果要转为动态的查询,即不固定对A、B、C、D进行透视转换呢?请看下面:
先分析,如果是动态查询,那么肯定需要拼凑SQL语句,即对“SUM(CASE WHEN custid = 'A' THEN qty END) AS A,”这一部分进行拼凑。首先想到要用“SELECT custid FROM [tempdb].[dbo].[Orders] GROUP BY custid”把A、B、C、D等数据GROUP BY 查出来,然后对这个数据集使用游标循环拼凑出SQL语句,但是现在还有更方便的方法。先看一个测试:
DECLARE @temp NVARCHAR(50);
SET @temp = '';
SELECT @temp = @temp + ',' + custid
FROM ( SELECT custid
FROM [tempdb].[dbo].[Orders]
GROUP BY custid
) AS T;
PRINT @temp;
上面这段SQL会输出“,A,B,C,D”,这说明了想循环读取数据集并赋值不一定要用游标,别忘了SELECT也是可以赋值的!所以透视转换的动态SQL如下:
DECLARE @sql NVARCHAR(800);
SET @sql = 'SELECT empid';
SELECT @sql = @sql + ',SUM(CASE WHEN custid=''' + custid
+ ''' THEN qty END) AS ' + QUOTENAME(custid)
FROM ( SELECT custid
FROM [tempdb].[dbo].[Orders]
GROUP BY custid
) AS T
SET @sql = @sql + ' FROM dbo.Orders GROUP BY empid';
EXEC(@sql);
下面是使用T-SQL PIVOT运算符进行透视转换。SQL Server 2005引入了一个T-SQL特有的表运算符PIVOT,PIVOT运算符同样涉及三个逻辑处理阶段(分组、扩展和聚合)。注意,一般不直接把PIVOT运算符应用到源表,而是将其应用到一个表表达式(该表表达式只包含透视转换需要的3种元素,不包含其他属性):
SELECT empid, A, B, C, D
FROM (SELECT empid, custid, qty
FROM dbo.Orders) AS D
PIVOT(SUM(qty) FOR custid IN(A, B, C, D)) AS P;
上面代码中PIVOT操作符并没有直接操作Orders表,而是对一个名为D的派生表进行操作,该派生表只包含透视转换元素empid、custid、qty。
逆透视转换
需求如下,原数据如下:
现在需要得到这样的数据:
使用标准SQL进行逆透视转换。逆透视转换的标准SQL解决方案非常明确地要实现3个逻辑处理阶段:生成副本、提取元素和删除不相关的交叉。
SELECT empid, custid,
CASE custid
WHEN 'A' THEN A
WHEN 'B' THEN B
WHEN 'C' THEN C
WHEN 'D' THEN D
END AS qty
FROM dbo.EmpCustOrders
CROSS JOIN (VALUES('A'),('B'),('C'),('D')) AS Custs(custid);
执行结果如下:
如果还想进一步过滤掉含有null值的数据,则可以这样:
SELECT *
FROM (SELECT empid, custid,
CASE custid
WHEN 'A' THEN A
WHEN 'B' THEN B
WHEN 'C' THEN C
WHEN 'D' THEN D
END AS qty
FROM dbo.EmpCustOrders
CROSS JOIN (VALUES('A'),('B'),('C'),('D')) AS Custs(custid)) AS D
WHERE qty IS NOT NULL;
使用T-SQL的UNPIVOT运算符进行逆透视转换:
SELECT empid, custid, qty
FROM dbo.EmpCustOrders
UNPIVOT(qty FOR custid IN(A, B, C, D)) AS U;
分组集
GROUPING SETS从属子句:
SELECT empid, custid, SUM(qty) AS sumqty
FROM dbo.Orders
GROUP BY
GROUPING SETS
(
(empid, custid),
(empid),
(custid),
()
);
CUBE从属子句
SELECT empid, custid, SUM(qty) AS sumqty
FROM dbo.Orders
GROUP BY CUBE(empid, custid);