前言描述
最近在一个生产环境中准备采用mha架构替换目前现网的主从架构,之前为两台服务器一主一从,没有使用vip;架构调整后为4台服务器,1主+1备用主+2slave,2台slave用于处理数据库读请求。两台slave 和备用slave都已开启read_only状态。
问题现象
由于目前生产库所占用磁盘空间为158GB,因此采用xtarbackup进行在线物理备份,当对两台slave节点做完主从同步后一段时间后两台主从复制频繁报1032 1062错误,
问题排查
根据报错提示,发现报1062错误时是由于两边都包含相同的数据,因此会报此类错误。因此猜想备库有人写入,不过库已被我设定成read_only状态了呀?查看后发现read_only对super账户没有作用,而且目前生产环境中对用户这块使用没有严格控制,各应用均使用有super权限的账户进行执行,好吧这个是个问题,但是我先不改,现在考虑是谁在进行写操作。目前调整架构是我自己在做,没有其他人操作从库,所以我考虑应该mysql中有事件被调用,经过排查发现库中确实存在事件,并且任务调度器处于被开启状态。因此问题应该是事件被执行后两库产生相同数据因此无法进行复制而报错。
查看时间调度器状态:
mysql> show variables like '%event_scheduler%';
+-----------------+-------+
| Variable_name | Value |
+-----------------+-------+
| event_scheduler | ON |
+-----------------+-------+
1 row in set (0.00 sec)
mysql>
但是!!!请注意之前的从库也存在这些事件,事并且件调度器也处于开启状态。 好吧,有点难以解释了。先不考虑那么多,将新添加的两台服务器的事件调度器关闭,再进行观察,关闭方式如下:
# 关闭事件执行
SET GLOBAL event_scheduler = off;
果然新添加的两个库没有类似的错误,但是之前从库的现象如何解释呢???
翻阅一些资料的时候发现了这个问题:
由于第一个从库是配置完主从复制后向主库中导入数据,此时事件调度器在主库的status:ENABLED;备库的status:SLAVESIDE_DISABLED状态。而后面添加的两台主机均是从主几点物理备份恢复,因此状态和主库一致。
#主库
use blxx_mobile;
show events \G
*************************** 6. row ***************************
Db: blxx_mobile
Name: handle_source_domain_event
Definer: blxx@%
Time zone: SYSTEM
Type: RECURRING
Execute at: NULL
Interval value: 1
Interval field: DAY
Starts: 2014-07-13 12:00:00
Ends: NULL
Status: ENABLED
Originator: 2
character_set_client: utf8
collation_connection: utf8_general_ci
Database Collation: utf8_general_ci
#从库
*************************** 6. row ***************************
Db: blxx_mobile
Name: handle_source_domain_event
Definer: blxx@%
Time zone: SYSTEM
Type: RECURRING
Execute at: NULL
Interval value: 1
Interval field: DAY
Starts: 2014-07-13 12:00:00
Ends: NULL
Status: SLAVESIDE_DISABLED
Originator: 2
character_set_client: utf8
collation_connection: utf8_general_ci
Database Collation: utf8_general_ci
总结
1.使用mysql库时最好对账户权限进行控制
2.若使用xtrabackup配置主从复制时如果从主库进行备份则恢复到从库时需要将事件关闭,防止备库也进行写入。不过这样若配置主主复制或mha复制时发生故障切换,主从切换原从库被提升为主库后,需要将其事件调度器打开。而且使用xtrabackup进行备份为了减轻主库压力请尽量备份从库,并添加--slave-info参数,这样也可通过备份文件添加新的主库。
记录此问题,希望对遇到类似的问题的同学提供帮助。