1、业务逻辑及表介绍

数据库表介绍:
table_a:主表(小表,表数据不可重复)
table_b:流水表(大表,记录审核流水数据)
注:两表表结构大致一致,流水表增加一个审核状态的字段

业务逻辑:
主表保存唯一数据,流水表记录审核流水数据,用于后续展示,并在审核成功后插入主表,在插入流水数据时完成重复数据的覆盖。覆盖逻辑为先删后加,也就是在这里,出现了联表删除慢的问题。

2、优化思路

原联表删除SQL语句 :
delete from table_a where id in (SELECT id FROM table_b );

优化后的联表删除SQL语句(懒得继续看的,到这即可) :
delete from table_a where exists (SELECT t.id from (select a.id from table_a a,table_b b where a.id=b.id) t where a.id=table_a.id);

3、优化原理:

本次优化总结讲是将in ==》exists

a、那一定是exists比in语句的效率高吗?

mysql中的 in 语句是把外表和内表作hash 连接,而exists语句是对外表作loop循环,每次loop循环再对内表进行查询。所以可见,这种说法其实是不准确的。实际是要区分环境的:

  1. 如果查询的两个表大小相当,那么用in和exists差别不大。
  2. 如果两个表中一个较小,一个是大表,则子查询表大的用exists,子查询表小的用in。
  3. 此外,in与exists的索引使用情况为:in 前表索引,exists 后表索引,用上索引的快。

b、not in 和not exists的比较:

  1. not in 和not exists如果查询语句使用了not in 那么内外表都进行全表扫描,没有用到索引;
  2. not extsts 的子查询依然能用到表上的索引。

结论: 无论哪个表大,用not exists都比not in要快

c、in 与 = 的区别不大

验证过程略…(感兴趣的话自行验证哈(o-))

4、记录一个优化过程中遇到的问题

sql: delete from table_a where exists (select a.idfrom table_a a,table_b b where a.id=b.id);
报错: You can’t specify target table ‘table_a’ for update in FROM clause(不能在FROM子句中为更新指定目标表)
解决方法: mysql 可以通过子查询得到要删除的记录条件,然后通过子查询得结果匹配要删除的记录。但是 mysql 不能直接删除子查询表中的数据,必须通过一个临时表来解决。