CREATE TABLE `fact` (

  `i` int(10) UNSIGNED NOT NULL,

  `val` int(10) UNSIGNED NOT NULL,

  KEY `i` (`i`,`val`)

)

 

CREATE TABLE `dim` (

  `id` int(10) UNSIGNED NOT NULL AUTO_INCREMENT,

  `pad` varchar(100) NOT NULL,

  PRIMARY KEY  (`id`)

)

a)SELECT count(*) FROM dim

30720

b)SELECT count(*) FROM fact

7340032

c)SELECT count(*) FROM fact WHERE i<10000

733444

d)SELECT count(*) FROM fact LEFT JOIN dim ON val=id WHERE i<10000

733444

以下查询哪个更快?

 

(1)SELECT i,pad FROM fact LEFT JOIN dim ON val=id WHERE i<10000 LIMIT 500000,10;

(2)SELECT i,pad FROM (SELECT i,val FROM fact WHERE i<10000 LIMIT 500000,10) res LEFT JOIN dim ON val=id;

 

第一个查询:从fact表中得到i<10000的行,再和dim进行连接;连接后,从第500000行起取10行(相当于最多7340032+733444*30720行要被扫描)

第二个查询:从fact表中得到i<10000的行,从第500000行起取10行;再和dim表进行连接(相当于最多7340032+10*30000行要被扫描)

 

显然第二个查询更快,那么第二个查询和第一个查询的结果相等吗?

由于上述c和d查询返回的行数相同,说明fact表中的每一行在dim表中都有相应的行与之对应,因此第二个查询和第一个查询是结果是相同的;因此,在上述情况下,使用第二个查询更快!