一、MySQL+MyCat分库分表
1 MyCat简介
java编写的数据库中间件
Mycat运行环境需要JDK.
Mycat是中间件.运行在代码应用和MySQL数据库之间的应用.
前身 : corba. 是阿里开发的数据库中间件.实现MySQL数据库分库分表集群管理的中间件.曾经出现过重大事故. 二次开发,形成Mycat.
使用MyCat之后,编写的所有的SQL语句,必须严格遵守SQL标准规范.
insert into table_name(column_name) values(column_value);
使用MyCat中间件后的结构图如下:
2 MyCat术语简介
2.1 切分
逻辑上的切分. 在物理层面,是使用多库[database],多表[table]实现的切分.
2.1.1 纵向切分
把一个数据库切分成多个数据库,配置方便
只能实现两张表的表连接查询.
将一张表中的数据,分散到若干个database的同结构表中。多个表的数据的集合是当前表格的数据。
clip_image006.png
2.1.2 横向切分
把一个表切分成多个表,相比纵向切分配置麻烦
无法实现表连接查询.
将一张表的字段,分散到若干张表中,将若干表连接到一起,才是当前表的完整数据。
clip_image007.png
2.2 逻辑库
Mycat中定义的database.是逻辑上存在的.但是物理上未必存在.
主要是针对纵向切分提供的概念.
访问MyCat,就是将MyCat当做MySQL使用。
Db数据库是MyCat中定义的database。通过SQL访问MyCat中的db库的时候,对应的是MySQL中的db1,db2,db3三个库。物理上的database是db1,db2,db3.逻辑上的database就是db。
clip_image008.png
2.3 逻辑表
Mycat中定义的table.是逻辑上存在,物理上未必存在.
主要是针对横向切分提供的概念
MyCat中的表格table,其字段分散到MySQL数据库的表格table1,table2,table3中。
clip_image009.png
2.4 默认端口
Mycat默认端口是8066
2.5 数据主机 - dataHost
物理MySQL存放的主机地址.可以使用主机名,IP,域名定义.
2.6 数据节点 - dataNode
物理的database是什么.数据保存的物理节点.就是database.
2.7 分片规则
当控制数据的时候,如何访问物理database和table.
就是访问dataHost和dataNode的算法.
在Mycat处理具体的数据CRUD的时候,如何访问dataHost和dataNode的算法.如:哈希算法,crc16算法等.
3 Mycat搭建
3.1 安装JDK
略
3.2 主从备份搭建完成
3.3 安装mycat
解压缩: tar -zxf mycat-xxxx.tar.gz
3.4 Master提供可被Mycat访问的用户
在Mycat中通过Master数据库的root用户访问Master数据库.
grant all privileges on . to ‘username’@’ip’ identified by ‘password’ with grant option;
grant all privileges on . to 'mycat'@'%' identified by 'mycat' with grant option;
3.5 上传mycat
Mycat-server-1.6-RELEASE-20161028204710-linux.tar.gz
3.6 解压缩
tar -zxf Mycat-server-1.6-RELEASE-20161028204710-linux.tar.gz
3.7 Mycat配置文件详解
Mycat所有的配置文件,都在应用的conf目录中.
3.7.1 rule.xml
用于定义分片规则的配置文件.
主要是查看.很少修改.
mycat默认的分片规则: 以500万为单位,实现分片规则.
逻辑库A对应dataNode - db1和db2. 1-500万保存在db1中, 500万零1到1000万保存在db2中,1000万零1到1500万保存在db1中.依次类推.
idrang-long
crc32slot规则: 在CRUD操作时,根据具体数据的crc32算法计算,数据应该保存在哪一个dataNode中. 算法类似模运算.
idcrc32slot
3.7.2 schema.xml
用于定义逻辑库和逻辑表的配置文件.在配置文件中可以定义读写分离,逻辑库,逻辑表,dataHost,dataNode等信息.
配置文件解释:
3.7.2.1 标签schema
配置逻辑库的标签
3.7.2.1.1 属性name
逻辑库名称
3.7.2.1.2 属性checkSQLschema
是否检测SQL语法中的schema信息.
如: Mycat逻辑库名称 A, dataNode名称B
SQL : select * from A.table;
checkSQLschema值是true, Mycat发送到数据库的SQL是select * from table;
checkSQLschema值是false,Mycat发送的数据库的SQL是select * from A.table;
3.7.2.1.3 sqlMaxLimit
Mycat在执行SQL的时候,如果SQL语法中没有limit子句.自动增加limit子句. 避免一次性得到过多的数据,影响效率. limit子句的限制数量默认配置为100.如果SQL中有具体的limit子句,当前属性失效.
SQL : select * from table . mycat解析后: select * from table limit 100
SQL : select * from table limit 10 . mycat不做任何操作修改.
3.7.2.2 标签table
定义逻辑表的标签,如果需要定义多个逻辑表,编写多个table标签。要求逻辑表的表名和物理表(MySQL数据库中真实存在的表)的表名一致。
3.7.2.2.1 属性name
逻辑表名
3.7.2.2.2 属性dataNode
数据节点名称. 配置文件中后续需要定义的标签(即物理数据库中的database名称).多个名称使用逗号分隔.
多个database定义后,代表分库。
3.7.2.2.3 属性rule
分片规则名称.具体的规则名称参考rule.xml配置文件.
SQL语句发送到Mycat中后,Mycat如何计算,应该将当期的SQL发送到哪一个物理数据库管理系统或物理database中。
3.7.2.3 标签dataNode
定义数据节点的标签, 定义具体的物理database信息的。
3.7.2.3.1 属性name
数据节点名称, 是定义的逻辑名称,对应具体的物理数据库database
3.7.2.3.2 属性dataHost
引用dataHost标签的name值,代表使用的物理数据库所在位置和配置信息.
3.7.2.3.3 属性database
在dataHost物理机中,具体的物理数据库database名称.
3.7.2.4 dataHost标签
定义数据主机的标签, 就是物理MYSQL真实安装的位置。
3.7.2.4.1 属性name
定义逻辑上的数据主机名称
3.7.2.4.2 属性maxCon/minCon
最大连接数, max connections
最小连接数, min connections
3.7.2.4.3 属性dbType
数据库类型 : mysql数据库
3.7.2.4.4 属性dbDriver
数据库驱动类型, native,使用mycat提供的本地驱动.
3.7.2.5 dataHost子标签writeHost
写数据的数据库定义标签. 实现读写分离操作.
3.7.2.5.1 属性 host
数据库命名
3.7.2.5.2 属性url
数据库访问路径
3.7.2.5.3 属性user
数据库访问用户名
3.7.2.5.4 属性password
访问用户密码
3.7.2.6 测试配置文件
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
select user()
password="root"/>
3.7.3 server.xml
配置Mycat服务信息的.
如: Mycat中的用户,用户可以访问的逻辑库,可以访问的逻辑表,服务的端口号等.
常见修改内容:
8066
9066
密码
用户可访问逻辑库名
密码
可访问逻辑库名
是否只读
3.7.4 启动Mycat命令
bin/mycat start
3.7.5 停止命令
bin/mycat stop
3.7.6 重启命令
bin/mycat restart
3.7.7 查看Mycat状态
bin/mycat status
3.7.8 访问方式
可以使用命令行访问或客户端软件访问.
3.7.8.1 命令行访问方式
mysql -u用户名 -p密码 -hmycat主机IP -P8066
链接成功后,可以当做MySQL数据库使用.
访问成功后,不能直接使用。因为Mycat只能访问MYSQL的schema(database),不能自动创建逻辑库对应的物理库。且不能自动创建逻辑表对应的物理表。
必须人工链接master数据库,手动创建database。
表格可以在mycat控制台创建。注意:在mycat控制台创建的表,必须是schema.xml配置文件中定义过的逻辑表。
启动后,经过测试,crc32slot分片规则无效,执行DML语句的时候只能识别db1和db2。
DDL语句,可以识别db3。
修改conf/rule.xml配置文件,找标签
2
修改count参数。修改为对应的物理database数量。
3.7.9 访问约束
3.7.9.1 表约束
不能创建未在schema.xml中配置的逻辑表
3.7.9.2 DML约束
尤其是新增: 必须在insert into语法后携带所有的字段名称.至少携带主键名称.
因为分片规则,绝大多数都是通过主键字段计算数据分片规则的.
3.7.10 查看Mycat日志
logs/wrapper.log
日志中记录的是所有的mycat操作. 查看的时候主要看异常信息caused by信息
二、MyCat配置读写分离
1 MySQL主从备份
1.1 主从备份概念
什么是主从备份: 就是一种主备模式的数据库应用.
主库(Master)数据与备库(Slave)数据完全一致.
实现数据的多重备份, 保证数据的安全.
可以在Master[InnoDB]和Slave[MyISAM]中使用不同的数据库引擎,实现读写的分离
1.1.1 MySQL5.5版本后本身支持主从备份
在老旧版本的MySQL数据库系统中,不支持主从备份,需要安装额外的RPM包.
如果需要安装RPM,只能在一个位置节点安装.
1.1.2 主从备份目的
1.1.2.1 实现主备模式
保证数据的安全. 尽量避免数据丢失的可能.
1.1.2.2 实现读写分离
使用不同的数据库引擎,实现读写分离.提高所有的操作效率.
InnoDB使用DML语法操作. MyISAM使用DQL语法操作.
1.1.3 主从备份效果
1.1.3.1 主库操作同步到备库
所有对Master的操作,都会同步到Slave中.
如果Master和Salve天生上环境不同,那么对Master的操作,可能会在Slave中出现错误
如: 在创建主从模式之前,Master有database : db1, db2, db3. Slave有database: db1, db2.
创建主从模式.现在的情况Master和Slave天生不同.
主从模式创建成功后,在Master中drop database db3. Slave中抛出数据库SQL异常.后续所有的命令不能同步.
一旦出现错误. 只能重新实现主从模式.
1.2 安装MySQL
略过.
1.3 主从备份配置
主要操作Master和Slave中的配置文件和DBMS的配置.
配置文件: 定义主从模式的基础信息. 如: 日志, 命令等.
DBMS配置: 提供主从访问的用户,基础信息[Master和Slave的位置,用户名,密码,日志文件名等]等.
建议:建立主从备份的多个MySQL,最好原始环境一致。Database,table,data完全一致。
1.3.1 Master[主库]配置
1.3.1.1 修改Master配置文件
/etc/my.cnf
需要修改. 在修改前建议复制一份备份文件.
修改后的my.cnf配置文件,参考资料中的my.cnf文件内容.
1.3.1.1.1 server-id
本环境中server-id是1
MySQL服务唯一标识
唯一标识是数字. 自然数
配置的时候有要求
1.3.1.1.1.1 单机使用
server-id 任意配置,只要是数字即可
1.3.1.1.1.2 主从使用
server-id Master唯一标识数字必须小于Slave唯一标识数字.
1.3.1.1.2 log_bin
本环境中log_bin值 : master_log
日志文件命名, 开启日志功能。此日志是命令日志。就是记录主库中执行的所有的SQL命令的。
1.3.1.1.2.1 开启日志
MySQL的log_bin不是执行日志,状态日志. 是操作日志.就是在DBMS中所有的SQL命令
log_bin日志不是必要的.只有配置主从备份时才必要。
1.3.1.1.2.2 日志文件配置
变量的值就是日志文件名称.是日志文件名称的主体.
MySQL数据库自动增加文件名后缀和文件类型.
1.3.1.2 重启MySQL
service mysqld restart
1.3.1.3 配置Master
1.3.1.3.1 访问MySQL
mysql -uusername -ppassword
1.3.1.3.2 创建用户
在MySQL数据库中,为不存在的用户授权,就是同步创建用户并授权.
此用户是从库访问主库使用的用户
ip地址不能写为%. 因为主从备份中,当前创建的用户,是给从库Slave访问主库Master使用的.用户必须有指定的访问地址.不能是通用地址.
grant all privileges on . to ‘username’@’ip’ identified by ‘password’ with grant option;
flush privileges;
grant all privileges on . to 'slave'@'192.168.199.133' identified by 'slave' with grant option; flush privileges;
1.3.1.3.3 查看用户
use mysql;
select host, name from user;
1.3.1.3.4 查看Master信息
show master status;
1.3.2 Slave[从库]配置
1.3.2.1 修改Slave配置文件
/etc/my.cnf
1.3.2.1.1 server_id
唯一标识, 本环境中配置为 : 2
1.3.2.1.2 log_bin
可以使用默认配置, 也可以注释.
1.3.2.2 可选: 修改uuid
主从模式要求多个MySQL物理名称不能相同. 即按装MySQL过程中Linux自动生成的物理标志. 唯一物理标志命名为uuid. 保存位置是MySQL数据库的数据存放位置. 默认为/var/lib/mysql目录中. 文件名是auto.cnf.
修改auto.cnf文件中的uuid数据. 随意修改,不建议改变数据长度.建议改变数据内容.
/var/lib/mysql/auto.cnf
1.3.2.3 重启MySQL服务
service mysqld restart
1.3.2.4 配置Slave
1.3.2.4.1 访问mysql
mysql -uusername -ppassword
1.3.2.4.2 停止Slave功能
stop slave
1.3.2.4.3 配置主库信息
需要修改的数据是依据Master信息修改的. ip是Master所在物理机IP. 用户名和密码是Master提供的Slave访问用户名和密码. 日志文件是在Master中查看的主库信息提供的.在Master中使用命令show master status查看日志文件名称.
change master to master_host=’ip’, master_user=’username’, master_password=’password’, master_log_file=’log_file_name’;
change master to master_host='192.168.199.212', master_user='slave', master_password='slave', master_log_file='master_log.000001';
1.3.2.4.4 启动Slave功能
start slave;
1.3.2.4.5 查看Slave配置
show slave status \G;
2 MyCat读写分离配置
修改conf/schema.xml配置文件,下述内容中,红色部分为重点内容。
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
select user()
password="root">
三、MyCat配置数据库集群
所有的集群配置,都必须配置多主多从模式。即多个master节点相互之间配置主从。如:master1和slave1为第一组主从,master2和slave2为第二组主从,master1和master2互为对方的主/从。
注意:crc32slot分片规则,在使用的时候,要求必须先设置好分片规则,再启动mycat。如果先启动了mycat,再设置分片规则,会导致分片规则失效。需要删除conf目录中的ruledata子目录。ruledata目录中会记录crc32slot的分片节点,日志文件命名规则为crc32slot_表名
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
select user()
password="root">
password="root">
缺陷:可能有IO延迟问题。
四、数据库集群负载策略
第一种配置方案:
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
select user()
password="root">
password="root">
第二种配置方案:
writeType="0" dbType="mysql" dbDriver="native" switchType="2" slaveThreshold="100">
show slave status
password="root">
writeType="0" dbType="mysql" dbDriver="native" switchType="2" slaveThreshold="100">
show slave status
password="root">
1 balance属性
balance=”0”, 不开启读写分离机制,所有读操作都发送到当前可用的 writeHost 上
balance=”1”,全部的 readHost 与 stand by writeHost 参与 select 语句的负载均衡
balance=”2”,所有读操作都随机的在 writeHost、 readhost 上分发。
balance=”3”, 所有读请求随机的分发到 writeHost 对应的 readhost 执行,writerHost 不负担读压力
2 writeType 属性
writeType=”0”, 所有写操作发送到配置的第一个 writeHost,第一个挂了切到还生存的第二个writeHost,重新启动后已切换后的为准,切换记录在配置文件中:conf/dnindex.properties(datanode index)
writeType=”1”,所有写操作都随机的发送到配置的writeHost,1.5以后废弃不推荐
3 switchType属性
也涉及到读写分离问题,可以解决IO延迟问题。
switchType='-1' 表示不自动切换
switchType='1' 默认值,表示自动切换
switchType='2' 基于MySQL主从同步的状态决定是否切换读写主机,心跳语句为 show slave status。 当心跳监测获取的数据发现了IO的延迟,则读操作自动定位到writeHost中。如果心跳监测获取的数据没有IO延迟,则读操作自动定位到readHost中。建议为不同的表格定位不同的dataHost节点。
注意: 在mycat中,rule.xml配置文件中定义的分片规则只能给一个表格使用。如果有多个表格使用同一个分片规则,需要再rule.xml配置文件中,为每个表格定义一个分片规则。如:
id
crc32slot
id
crc32slot