正确的做法是:把重复值最少的放前面。比如,95%的值都不重复,则可考虑放最前面。
字段顺序的影响
复合索引遵从最左匹配原则,那么在where查询条件中的字段是否也需要按照索引的顺序来写呢?
比如,复合索引为(c1,c2,c3),下面两个查询条件是否会对索引有影响呢?
select * from t_user where c1 = 1 and c2 = 4;
select * from t_user where c2 = 4 and c1 = 1;
看到有文章提出第一条SQL语句的效率更高,是否可信?两种查询方式条件一样,结果也应该一样,正常来说Mysql也会让它们走同样的索引。
通过Mysql的查询优化器explain分析上述两个条语句,会发现执行计划完全相同。也就是说:SQL语句中的字段顺序并不需要与复合索引字段顺序一致,查询优化器会自动调整顺序。
如果说有效率影响,那么也就是查询优化器矫正顺序的影响吧,几乎可以忽略不计。
单字段是否可以触发索引?
对于复合索引为(c1,c2,c3),相当于(c1),(c1,c2),(c1,c2,c3)三个索引,如果查询条件中只有c1,很显然是会走索引的。
但如果where条件如下呢:
from t_user where c2 = 4;
上述语句是否会走索引呢?这得分几种情况来说明。
执行explan查询c1为条件的SQL语句:
explain select * from t_user where c1 = 1;
上述语句走的索引类型为:ref。ref类型表示Mysql会根据特定的算法快速查找到符合条件的索引,而不会对索引中每一个数据都进行扫描判断。这种类型的索引为了快速查出数据,索引就需要满足一定的数据结构。
执行explan查询c2为条件的SQL语句:
explain select c2 from t_user where c2 = 4;
上述语句走的索引类型为:index。index类型表示Mysql会对整个索引进行扫描,只要是索引或索引的一部分Mysql就可能会采用index方类型的方式扫描。由于此种方式是一条数据一条数据查找,性能并不高。
在这个例子中,对查询的字段有一定的要求,where中条件为c2,select中查询出的字段也只能是c2,才会走index类型的索引。
如果将c2换成*或其他字段:
explain select * from t_user where c2 = 4;
上述语句会发现,不再走index索引,而是走全表扫描了。这也从侧面说明了Mysql为什么要讲最左匹配原则了。
所以结论是:如果单个字段为复合索引的首个字段,则会正常走索引;如果单个字段是复合索引的其他字段,且仅有该字段出现在select后面,则会走index类型索引;而其他情况,则走全表扫描。