CREATE TABLE `fact` (
`i` int(10) UNSIGNED NOT NULL,
`val` int(10) UNSIGNED NOT NULL,
KEY `i` (`i`,`val`)
)
CREATE TABLE `dim` (
`id` int(10) UNSIGNED NOT NULL AUTO_INCREMENT,
`pad` varchar(100) NOT NULL,
PRIMARY KEY (`id`)
)
a)SELECT count(*) FROM dim
30720
b)SELECT count(*) FROM fact
7340032
c)SELECT count(*) FROM fact WHERE i<10000
733444
d)SELECT count(*) FROM fact LEFT JOIN dim ON val=id WHERE i<10000
733444
以下查询哪个更快?
(1)SELECT i,pad FROM fact LEFT JOIN dim ON val=id WHERE i<10000 LIMIT 500000,10;
(2)SELECT i,pad FROM (SELECT i,val FROM fact WHERE i<10000 LIMIT 500000,10) res LEFT JOIN dim ON val=id;
第一个查询:从fact表中得到i<10000的行,再和dim进行连接;连接后,从第500000行起取10行(相当于最多7340032+733444*30720行要被扫描)
第二个查询:从fact表中得到i<10000的行,从第500000行起取10行;再和dim表进行连接(相当于最多7340032+10*30000行要被扫描)
显然第二个查询更快,那么第二个查询和第一个查询的结果相等吗?
由于上述c和d查询返回的行数相同,说明fact表中的每一行在dim表中都有相应的行与之对应,因此第二个查询和第一个查询是结果是相同的;因此,在上述情况下,使用第二个查询更快!