问题描述:
由于业务需求,需要删除一些重复数据。即删除openid对应的2条数据,最终只保留一行。
MySQL数据库,sql语句比较简单:删除数据前,备份数据是必须的!
先来错误的演示:
1.先把错误数据查询出来
SELECT
id,
openid,
COUNT(*) as recCount
FROM tb_wx_user_info_bak
GROUP BY openid
HAVING COUNT( * ) > 1
2.根据要删除的数据的ID,进行删除
DELETE FROM tb_wx_user_info_bak WHERE id IN
(
SELECT
id,
openid,
COUNT(*) AS recCount
FROM tb_wx_user_info_bak
GROUP BY openid
HAVING COUNT( * ) > 1
)
一看就会,一做就废。
执行了上面的sql,果然,把sqlyog客户端的操作界面卡住了。
于是再开了个新的窗口。也不知道这个sql要执行多久,只能等着了。
3小时过后,这个sql窗口还是老样子,也不知道删除成功了多少数据。
在新的窗口中查询数据表,还是一样的数据量,应该是在卡住的窗口删除了一些数据但是没有提交,因此在新的窗口,数据量没有变化。
*****
在等待的时间中,想了想卡住的原因:
1.目标数据库表,同时执行新增数据与删除数据。
2.表的内存不足
3.删除语句没有使用索引。
4.删除数据的sql太差,一次删除的数据量太大(76330)
和同事请教后,得到建议:
1.优化sql
--建立要删除的数据ID构成的临时表id_temp
id:自增主键,id_data:要删除的数据ID
--把要删除的数据的ID插入表id_temp
Insert into id_temp(id_data) ( SELECT id FROM tb_wx_user_info_bak GROUP BY openid HAVING COUNT( * ) > 1 )
--把id_temp表中的id_data字段作为参数传给删除的sql
DELETE FROM tb_wx_user_info_bak WHERE id IN ( select id_data from id_temp where id > 0 and id < 5000 )
每次只删除5000条数据。避免批量处理导致MySQL无法处理数据的问题。
2.要优化具体的sql,需要结合实际场景。
譬如,要模拟大量用户操作一张表的数据,从而实现同时删除数据和插入数据到表中的情景。
达到了上述条件,再对sql的每一部分进行优化,了解sql的性能瓶颈在哪一块。
以上面的sql为例:
DELETE FROM tb_wx_user_info_bak WHERE id IN ( select id_data from id_temp where id > 0 and id < 5000 )
该sql的性能瓶颈可能处于子查询中,要解决查询的性能瓶颈,可以从索引入手,建立索引提高查询效率。
修改好sql以后,发布服务器操作记录
实际操作记录
[unicorn@unicomm auaa-audit]#
[unicorn@unicomm auaa-audit]# ./app.sh startDev
-bash: ./app.sh: Permission denied ###错误1:缺少操作权限
[unicorn@unicomm auaa-audit]#
[unicorn@unicomm auaa-audit]#
[unicorn@unicomm auaa-audit]# sudo ./app.sh startDev
sudo: ./app.sh: command not found
[unicorn@unicomm auaa-audit]#
[unicorn@unicomm auaa-audit]# chmod +x app.sh
[unicorn@unicomm auaa-audit]#
[unicorn@unicomm auaa-audit]#
---
[unicorn@unicomm auaa-audit]# sudo ./app.sh startDev
sudo: unable to execute ./app.sh: No such file or directory ###错误2:编码格式错误
[unicorn@unicomm auaa-audit]# pwd
/u02/auaa-audit/tmp/auaa-audit
[unicorn@unicomm auaa-audit]# file -i app.sh
app.sh: text/x-shellscript; charset=utf-8
[unicorn@unicomm auaa-audit]#
[unicorn@unicomm auaa-audit]#
[unicorn@unicomm auaa-audit]# iconv app.sh -f utf-8 -t UNICODE -o app.sh --verbose
app.sh:
[unicorn@unicomm auaa-audit]#
[unicorn@unicomm auaa-audit]#
[unicorn@unicomm auaa-audit]# file -i app.sh
app.sh: text/plain; charset=utf-16le #修改编码格式成功
---
[unicorn@unicomm auaa-audit]# ./app.sh startDev
-bash: ./app.sh: cannot execute binary file ###错误3:缺少可执行jar包
---
检查服务的启动参数等等
本次范爷检查出来的问题是:启动参数中定义的jdk的路径,找不到正确版本的jdk。
范爷把app.sh文件重新配置后,在185服务器商安装了jdk1.8后,配置了该服务器的JAVA_HOME环境变量等等。
[unicorn@unicomm jdk1.8.0_201]# pwd
/usr/local/jdk1.8.0_201
[unicorn@unicomm jdk1.8.0_201]# vi /etc/profile
---
修改profile文件内容如下:
#set java environment
export JAVA_HOME=/usr/local/jdk1.8.0_201
export PATH=$JAVA_HOME/bin:$PATH