Mysql学习笔记—MySQL集群架构之读写分离

1. 读写分离引入简介:

  1. 大多数互联网业务中,往往读多写少,这时候数据库的读会首先成为数据库的瓶颈。如果我们已经优化了SQL,但是读依旧还是瓶颈时,这时就可以选择“读写分离”架构了。
  2. 读写分离首先需要将数据库分为主从库,一个主库用于写数据,多个从库完成读数据的操作,主从库之间通过主从复制机制进行数据的同步,如下s图所示。
  3. 在应用中可以在从库追加多个索引来优化查询,主库这些索引可以不加,用于提升写效率。
  4. 读写分离架构也能够消除读写锁冲突从而提升数据库的读写性能。使用读写分离架构需要注意主从同步延迟读写分配机制问题

2. 主从同步延迟问题解决:

  1. 使用读写分离架构时,数据库主从同步具有延迟性,数据一致性会有影响,对于一些实时性要求比较高的操作,可以采用以下解决方案
  2. 写后立刻读
  1. 在写入数据库后,某个时间段内读操作就去主库,之后读操作访问从库。
  1. 二次查询
  1. 先去从库读取数据,找不到时就去主库进行数据读取。
  2. 该操作容易将读压力返还给主库,为了避免恶意攻击,建议对数据库访问API操作进行封装,有利于安全和低耦合。
  1. 根据业务特殊处理
  1. 根据业务特点和重要程度进行调整,比如重要的,实时性要求高的业务数据读写可以放在主库。
  2. 对于次要的业务,实时性要求不高可以进行读写分离,查询时去从库查询。

3. 读写分配机制: 同时也伴随着读写分配机制的实现

  1. 读写路由分配机制是实现读写分离架构最关键的一个环节,就是控制何时去主库写,何时去从库读。目前较为常见的实现方案分为以下两种:
  2. 基于编程和配置实现(应用端)
  1. 程序员在代码中封装数据库的操作,代码中可以根据操作类型进行路由分配,增删改时操作主库,查询时操作从库。
  2. 这类方法也是目前生产环境下应用最广泛的。
  3. 优点是实现简单,因为程序在代码中实现,不需要增加额外的硬件开支。
  4. 缺点是需要开发人员来实现,运维人员无从下手,如果其中一个数据库宕机了,就需要修改配置重启项目。
  1. 基于服务器端代理实现(服务器端)
  1. 中间件代理一般介于应用服务器和数据库服务器之间。
  2. 从下图中可以看到,应用服务器并不直接进入到master数据库或者slave数据库,而是进入MySQL proxy代理服务器。
  3. 代理服务器接收到应用服务器的请求后,先进行判断然后转发到后端master和slave数据库。

4. 目前有很多性能不错的数据库中间件: 常用的有MySQL Proxy、MyCat以及Shardingsphere等等

  1. MySQL Proxy:是官方提供的MySQL中间件产品可以实现负载平衡、读写分离等,是一个基于服务器端的代理。
  2. MyCat:MyCat是一款基于阿里开源产品Cobar而研发的,基于 Java 语言编写的开源数据库中间件。
  3. ShardingSphere:ShardingSphere是一套开源的分布式数据库中间件解决方案,它由ShardingJDBC、Sharding-Proxy和Sharding-Sidecar(计划中)这3款相互独立的产品组成。已经在2020年4月16日从Apache孵化器毕业,成为Apache顶级项目。
  4. Atlas:Atlas是由 Qihoo 360公司Web平台部基础架构团队开发维护的一个数据库中间件。
  5. Amoeba:变形虫,该开源框架于2008年开始发布一款 Amoeba for MySQL软件。

5. 读写分离实战: 主库可以进行读写,从库只能读

  1. 追加一台服务器,下载mysql-proxy的包,用作mysql-proxy的服务器
  2. 创建mysql-proxy的脚本,里面是一些读写指令,目录选择etc中,文件名是mysql-proxy.cnf,内容如下(proxy的端口是4040):
  3. 修改配置文件的权限,可读可写
chomd 660 /etc/mysql-proxy.cnf
  1. 修改配置文件中的连接池,修改最小连接数,之前最小链接数是4,只有4个才生效,所以先改成1
  2. 启动