目录
- 1、背景介绍:
- 2、思路&过程
- 明确distinct和group by的差异
- 数据不一致影响索引
- 改正后
- 3、总结:
1、背景介绍:
前端调用后端接口的时候发现接口的响应时间特别长,然后对后端接口进行分析。最后发现是sql语句的执行时间太长。看了一下sql语句的相关信息:course_id字段和class_id字段添加了索引,左连接两个表的id类型不一致,使用分组的方式进行去重。下面对sql语句进行分析。
2、思路&过程
sql执行顺序
以上sql语句的执行顺序为3->4->5->2->6->1
明确distinct和group by的差异
1.有索引的情况下,group by和distinct 都能用索引,效率相同
2.无索引的时候,distinct 效率高于 group by,distinct 是根据信息不同进行直接进行去重,group by 的原理是对结果先进行 分组排序 ,然后返回每组中的第一条数据。
3.如果是单纯的去重操作的话,无论是否有索引,distinct 的效率都更加高,但是如果 查询的列和去重的列不对应的话,distinct就无法使用了。相较于group by 不够灵活。
4.group by 的语义更加的明确,并且group by 可以根据分组的情况加上聚合函数,做一些其他的处理,功能更加丰富。但是有时候效率将低于distinct。
5.distinct用法
group by用法
数据不一致影响索引
可以看见这里的条件是courseid,classid,还有两个表的id
这里可以看到两张表的id类型不一致
创建索引如下
非两个表的id的那张临时表生效了
改正后
改正后生效了。
3、总结:
明确sql语句的执行顺序有助于我们对于sql语句进行优化。提高我们对数据库和sql语句的理解。来编写效率更高的语句。