一、为什么需要 Mysql 主从复制
1、在业务复杂的系统中,有这样一个情景,有一句sql语句需要锁表,导致暂时不能使用读的服务,那么就会影响运行中的业务,使用主从复制,让主库负责写,从库负责读,这样即使主库出现了锁表,通过读从库也可以保证业务的正常运作。
2、做数据的热备
冷备:读写操作均不可进行
温备:读操作可执行;但写操作不可执行
热备:读写操作均可执行
3、架构的扩展。业务量越来越大,I/O访问频率过高,单机无法满足,此时做多库的存储,降低磁盘I/O访问的频率,提高单个机器的I/O性能。
二、什么是 Mysql 的主从复制
数据可以从一个 MySQL 数据库服务器主节点复制到一个或多个从节点。MySQL 默认采用异步复制方式,这样从节点不用一直访问主服务器来更新自己的数据,数据的更新可以在远程连接上进行,从节点可以复制主数据库中的所有数据库或者特定的数据库,或特定的表。
三、Mysql 主从复制原理
主要过程如下:
(1)master 服务器将数据的改变记录二进制 binlog 日志,当 master 上的数据发生改变时,则将其改变写入二进制日志中;
(2)slave 服务器会在一定时间间隔内对 master 二进制日志进行探测其是否发生改变,如果发生改变,则开始一个 I/O Thread 请求 master 二进制事件
(3)同时主节点为每个 I/O 线程启动一个 dump 线程,用于向其发送二进制事件,并保存至从节点本地的中继日志中,从节点将启动SQL线程从中继日志中读取二进制日志,在本地重放,使得其数据和主节点的保持一致,最后 I/O Thread 和 SQL Thread 将进入睡眠状态,等待下一次被唤醒。
分析过程:
从库会生成两个线程,一个 I/O 线程,一个 SQL 线程;
I/O 线程会去请求主库的 binlog,并将得到的 binlog 写到本地的 relay-log (中继日志)文件中;
主库会生成一个 log dump 线程,用来给从库 I/O 线程传 binlog;
SQL 线程,会读取 relay log 文件中的日志,并解析成 sql 语句逐一执行;
注意:
1–master 将操作语句记录到 binlog 日志中,然后授予 slave 远程连接的权限(master一定要开启 binlog 二进制日志功能;通常为了数据安全考虑,slave 也开启 binlog 功能)。
2–slave 开启两个线程:IO 线程和 SQL 线程。其中:IO 线程负责读取 master 的 binlog 内容到中继日志 relay log 里;SQL 线程负责从 relay log 日志里读出 binlog 内容,并更新到 slave 的数据库里,这样就能保证 slave 数据和 master 数据保持一致。
3–Mysql 复制至少需要两个 Mysql 的服务,当然 Mysql 服务可以分布在不同的服务器上,也可以在一台服务器上启动多个服务。
4–Mysql 复制最好确保 master 和 slave 服务器上的 Mysql 版本相同(如果不能满足版本一致,那么要保证 master 主节点的版本低于 slave 从节点的版本)。
5–master 和 slave 两节点间时间需同步。
四、Mysql 主从同步延时分析
Mysql 的主从复制都是单线程的操作,主库对所有 DDL 和 DML 产生的日志写进 binlog,由于 binlog 是顺序写,所以效率很高,slave 的sql thread 线程将主库的 DDL 和 DML 操作事件在 slave 中重放。DML 和 DDL 的 IO 操作是随机的,不是顺序,所以成本要高很多,另一方面,由于 sql thread 也是单线程的,当主库并发较高时,产生的 DML 数量超过 slave 的 SQL thread 处理的速度,或者当 slave 中有大型 query 语句产生了锁等待,那么延时就产生了。
ps:SQL 语言共分为四大类:数据查询语言DQL,数据操纵语言DML,数据定义语言DDL,数据控制语言DCL。
常见原因:Master负载过高、Slave负载过高、网络延迟、机器性能太低、MySQL配置不合理。
解决方案:
1、分库,将一个主库拆分为多个主库,(可以是多主一从)这样每个主库的写并发会减少
2、单个库读写分离,一主多从,主写从读,分散压力。这样从库压力比主库高,保护主库
3、Mysql 支持的并行复制,多个库并行复制。但要是单库写入并发太高,并行复制并没有意义
4、升级 Slave 硬件配置