各文章各专题涉及到还原实践中的场景,原理,方法,模型,代码,原则,设计等;精心打造系列分享,阅读者仔细了解,必定有所收获,也可以收藏,日后工作中参考。
本文一共6个部分,分别讲的是,高并发场景下的数据库事务调优,索引的失效与优化,什么时候需要分表分库?如何避免死锁?数据库参数设置优化,电商系统表设计优化案例分析
部分1:高并发场景下的数据库事务调优
数据库事务是数据库系统执行过程中的一个逻辑处理单元,保证一个数据库操作要么成功, 要么失败。谈到他,就不得不提 ACID 属性了。数据库事务具有以下四个基本属性:原子 性(Atomicity)、一致性(Consistent)、隔离性(Isolation)以及持久性 (Durable)。正是这些特性,才保证了数据库事务的安全性。而在 MySQL 中,鉴于 MyISAM 存储引擎不支持事务,所以接下来的内容都是在 InnoDB 存储引擎的基础上进行 讲解的。 我们知道,在 Java 并发编程中,可以多线程并发执行程序,然而并发虽然提高了程序的执 行效率,却给程序带来了线程安全问题。事务跟多线程一样,为了提高数据库处理事务的吞吐量,数据库同样支持并发事务,而在并发运行中,同样也存在着安全性问题,例如,修改 数据丢失,读取数据不一致等。
在数据库事务中,事务的隔离是解决并发事务问题的关键, 今天我们就重点了解下事务隔 离的实现原理,以及如何优化事务隔离带来的性能问题。
并发事务带来的问题
我们可以通过以下几个例子来了解下并发事务带来的几个问题:
1. 数据丢失
2. 脏读
3. 不可重复读
4. 幻读
事务隔离解决并发问题
以上 4 个并发事务带来的问题,其中,数据丢失可以基于数据库中的悲观锁来避免发生, 即在查询时通过在事务中使用 select xx for update 语句来实现一个排他锁,保证在该事务 结束之前其他事务无法更新该数据。
当然,我们也可以基于乐观锁来避免,即将某一字段作为版本号,如果更新时的版本号跟之 前的版本一致,则更新,否则更新失败。剩下 3 个问题,其实是数据库读一致性造成的, 需要数据库提供一定的事务隔离机制来解决。
我们通过加锁的方式,可以实现不同的事务隔离机制。在了解事务隔离机制之前,我们不妨 先来了解下 MySQL 都有哪些锁机制。
InnoDB 实现了两种类型的锁机制:共享锁(S)和排他锁(X)。
共享锁允许一个事务读 数据,不允许修改数据,如果其他事务要再对该行加锁,只能加共享锁;
排他锁是修改数据 时加的锁,可以读取和修改数据,一旦一个事务对该行数据加锁,其他事务将不能再对该数 据加任务锁。
熟悉了以上 InnoDB 行锁的实现原理,我们就可以更清楚地理解下面的内容。
在操作数据的事务中,不同的锁机制会产生以下几种不同的事务隔离级别,不同的隔离级别 分别可以解决并发事务产生的几个问题,对应如下:
未提交读(Read Uncommitted):在事务 A 读取数据时,事务 B 读取和修改数据加了 共享锁。这种隔离级别,会导致脏读、不可重复读以及幻读。
已提交读(Read Committed):在事务 A 读取数据时增加了共享锁,一旦读取,立即释 放锁,事务 B 读取修改数据时增加了行级排他锁,直到事务结束才释放锁。也就是说,事 务 A 在读取数据时,事务 B 只能读取数据,不能修改。当事务 A 读取到数据后,事务 B 才能修改。这种隔离级别,可以避免脏读,但依然存在不可重复读以及幻读的问题。
可重复读(Repeatable Read):在事务 A 读取数据时增加了共享锁,事务结束,才释放 锁,事务 B 读取修改数据时增加了行级排他锁,直到事务结束才释放锁。也就是说,事务 A 在没有结束事务时,事务 B 只能读取数据,不能修改。当事务 A 结束事务,事务 B 才能 修改。这种隔离级别,可以避免脏读、不可重复读,但依然存在幻读的问题
可序列化(Serializable):在事务 A 读取数据时增加了共享锁,事务结束,才释放锁, 事务 B 读取修改数据时增加了表级排他锁,直到事务结束才释放锁。可序列化解决了脏 读、不可重复读、幻读等问题,但隔离级别越来越高的同时,并发性会越来越低。
InnoDB 中的 RC 和 RR 隔离事务是基于多版本并发控制(MVVC)实现高性能事务。一旦 数据被加上排他锁,其他事务将无法加入共享锁,且处于阻塞等待状态,如果一张表有大量 的请求,这样的性能将是无法支持的。
MVVC 对普通的 Select 不加锁,如果读取的数据正在执行 Delete 或 Update 操作,这时 读取操作不会等待排它锁的释放,而是直接利用 MVVC 读取该行的数据快照(数据快照是 指在该行的之前版本的数据,而数据快照的版本是基于 undo 实现的,undo 是用来做事务 回滚的,记录了回滚的不同版本的行记录)。MVVC 避免了对数据重复加锁的过程,大大 提高了读操作的性能。
锁具体实现算法
我们知道,InnoDB 既实现了行锁,也实现了表锁。行锁是通过索引实现的,如果不通过索 引条件检索数据,那么 InnoDB 将对表中所有的记录进行加锁,其实就是升级为表锁了。
行锁的具体实现算法有三种:record lock、gap lock 以及 next-key lock。record lock 是专门对索引项加锁;gap lock 是对索引项之间的间隙加锁;next-key lock 则是前面两 种的组合,对索引项以其之间的间隙加锁。
只在可重复读或以上隔离级别下的特定操作才会取得 gap lock 或 next-key lock,在 Select 、Update 和 Delete 时,除了基于唯一索引的查询之外,其他索引查询时都会获取 gap lock 或 next-key lock,即锁住其扫描的范围。
优化高并发事务
通过以上讲解,相信你对事务、锁以及隔离级别已经有了一个透彻的了解了。清楚了问题, 我们就可以聊聊高并发场景下的事务到底该如何调优了。
1. 结合业务场景,使用低级别事务隔离
在高并发业务中,为了保证业务数据的一致性,操作数据库时往往会使用到不同级别的事务 隔离。隔离级别越高,并发性能就越低
那换到业务场景中,我们如何判断用哪种隔离级别更合适呢?我们可以通过两个简单的业务 来说下其中的选择方法。
我们在修改用户最后登录时间的业务场景中,这里对查询用户的登录时间没有特别严格的准 确性要求,而修改用户登录信息只有用户自己登录时才会修改,不存在一个事务提交的信息 被覆盖的可能。所以我们允许该业务使用最低隔离级别。
而如果是账户中的余额或积分的消费,就存在多个客户端同时消费一个账户的情况,此时我 们应该选择 RR 级别来保证一旦有一个客户端在对账户进行消费,其他客户端就不可能对该 账户同时进行消费了。
2. 避免行锁升级表锁
前面讲了,在 InnoDB 中,行锁是通过索引实现的,如果不通过索引条件检索数据,行锁 将会升级到表锁。我们知道,表锁是会严重影响到整张表的操作性能的,所以我们应该避免 他。
3. 控制事务的大小,减少锁定的资源量和锁定时间长度
你是否遇到过以下 SQL 异常呢?在抢购系统的日志中,在活动区间,我们经常可以看到这 种异常日志:
MySQLQueryInterruptedException: Query execution was interrupted
由于在抢购提交订单中开启了事务,在高并发时对一条记录进行更新的情况下,由于更新记 录所在的事务还可能存在其他操作,导致一个事务比较长,当有大量请求进入时,就可能导 致一些请求同时进入到事务中。
又因为锁的竞争是不公平的,当多个事务同时对一条记录进行更新时,极端情况下,一个更 新操作进去排队系统后,可能会一直拿不到锁,最后因超时被系统打断踢出。
在用户购买商品时,首先我们需要查询库存余额,再新建一个订单,并扣除相应的库存。这 一系列操作是处于同一个事务的。
以上业务若是在两种不同的执行顺序下,其结果都是一样的,但在事务性能方面却不一样:
这是因为,虽然这些操作在同一个事务,但锁的申请在不同时间,只有当其他操作都执行 完,才会释放所有锁。因为扣除库存是更新操作,属于行锁,这将会影响到其他操作该数据 的事务,所以我们应该尽量避免长时间地持有该锁,尽快释放该锁。
又因为先新建订单和先扣除库存都不会影响业务,所以我们可以将扣除库存操作放到最后, 也就是使用执行顺序 1,以此尽量减小锁的持有时间。
总结
其实 MySQL 的并发事务调优和 Java 的多线程编程调优非常类似,都是可以通过减小锁粒 度和减少锁的持有时间进行调优。在 MySQL 的并发事务调优中,我们尽量在可以使用低 事务隔离级别的业务场景中,避免使用高事务隔离级别。
在功能业务开发时,开发人员往往会为了追求开发速度,习惯使用默认的参数设置来实现业 务功能。例如,在 service 方法中,你可能习惯默认使用 transaction,很少再手动变更事 务隔离级别。但要知道,transaction 默认是 RR 事务隔离级别,在某些业务场景下,可能 并不合适。因此,我们还是要结合具体的业务场景,进行考虑
部分2:索引的失效与优化
不知道你是否跟我有过同样的经历,那就是作为一个开发工程师,经常被 DBA 叫过去“批 评”,而最常见的就是申请创建新的索引或发现慢 SQL 日志了。
记得之前有一次迭代一个业务模块的开发,涉及到了一个新的查询业务,需要根据商品类 型、订单状态筛选出需要的订单,并以订单时间进行排序。由于 sku 的索引已经存在了, 我在完成业务开发之后,提交了一个创建 status 的索引的需求,理由是 SQL 查询需要使用 到这两个索引:
select * from order where status =1 and sku=10001 order by create_time asc
然而,DBA 很快就将这个需求驳回了,并给出了重建一个 sku、status 以及 create_time 组合索引的建议,查询顺序也改成了 sku=10001 and status=1。当时我是知道为什么要 重建组合索引,但却无法理解为什么要添加 create_time 这列进行组合。
从执行计划中,我们可以发现使用到了索引,那为什么 DBA 还要求将 create_time 这一列 加入到组合索引中呢?
MySQL 索引存储结构
索引是优化数据库查询最重要的方式之一,它是在 MySQL 的存储引擎层中实现的,所以 每一种存储引擎对应的索引不一定相同。我们可以通过下面这张表格,看看不同的存储引擎 分别支持哪种索引类型:
B+Tree 索引和 Hash 索引是我们比较常用的两个索引数据存储结构,B+Tree 索引是通过 B+ 树实现的,是有序排列存储,所以在排序和范围查找方面都比较有优势。
Hash 索引相对简单些,只有 Memory 存储引擎支持 Hash 索引。Hash 索引适合 key-value 键值对查询,无论表数据多大,查询数据的复杂度都是 O(1),且直接通过 Hash 索 引查询的性能比其它索引都要优越
在创建表时,无论使用 InnoDB 还是 MyISAM 存储引擎,默认都会创建一个主键索引,而 创建的主键索引默认使用的是 B+Tree 索引。不过虽然这两个存储引擎都支持 B+Tree 索 引,但它们在具体的数据存储结构方面却有所不同。
InnoDB 默认创建的主键索引是聚族索引(Clustered Index),其它索引都属于辅助索引 (Secondary Index),也被称为二级索引或非聚族索引。接下来我们通过一个简单的例
子,说明下这两种索引在存储数据中的具体实现。
首先创建一张商品表,如下:
CREATE TABLE `merchandise` (
`id` int(11) NOT NULL,
`serial_no` varchar(20) DEFAULT NULL,
`name` varchar(255) DEFAULT NULL,
`unit_price` decimal(10, 2) DEFAULT NULL,
PRIMARY KEY (`id`) USING BTREE
) CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;
然后新增了以下几行数据,如下:
如果我们使用的是 MyISAM 存储引擎,由于 MyISAM 使用的是辅助索引,索引中每一个 叶子节点仅仅记录的是每行数据的物理地址,即行指针,如下图所示:
如果我们使用的是 InnoDB 存储引擎,由于 InnoDB 使用的是聚族索引,聚族索引中的叶 子节点则记录了主键值、事务 id、用于事务和 MVVC 的回流指针以及所有的剩余列,如下 图所示:
基于上面的图示,如果我们需要根据商品编码查询商品,我们就需要将商品编码 serial_no 列作为一个索引列。此时创建的索引是一个辅助索引,与 MyISAM 存储引擎的主键索引的 存储方式是一致的,但叶子节点存储的就不是行指针了,而是主键值,并以此来作为指向行 的指针。这样的好处就是当行发生移动或者数据分裂时,不用再维护索引的变更。
如果我们使用主键索引查询商品,则会按照 B+ 树的索引找到对应的叶子节点,直接获取到 行数据:
select * from merchandise where id=7
如果我们使用商品编码查询商品,即使用辅助索引进行查询,则会先检索辅助索引中的 B+ 树的 serial_no,找到对应的叶子节点,获取主键值,然后再通过聚族索引中的 B+ 树检索 到对应的叶子节点,然后获取整行数据。这个过程叫做回表。
在了解了索引的实现原理后,我们再来详细了解下平时建立和使用索引时,都有哪些调优方 法呢?
1. 覆盖索引优化查询
假设我们只需要查询商品的名称、价格信息,我们有什么方式来避免回表呢?我们可以建立 一个组合索引,即商品编码、名称、价格作为一个组合索引。如果索引中存在这些数据,查 询将不会再次检索主键索引,从而避免回表。
从辅助索引中查询得到记录,而不需要通过聚族索引查询获得,MySQL 中将其称为覆盖索 引。使用覆盖索引的好处很明显,我们不需要查询出包含整行记录的所有信息,因此可以减 少大量的 I/O 操作。
通常在 InnoDB 中,除了查询部分字段可以使用覆盖索引来优化查询性能之外,统计数量 也会用到。例如,我们讲 SELECT COUNT(*) 时,如果不存在辅助索引,此时会 通过查询聚族索引来统计行数,如果此时正好存在一个辅助索引,则会通过查询辅助索引来 统计行数,减少 I/O 操作。
通过 EXPLAIN,我们可以看到 InnoDB 存储引擎使用了 idx_order 索引列来统计行数,如 下图所示:
2. 自增字段作主键优化查询
上面我们讲了 InnoDB 创建主键索引默认为聚族索引,数据被存放在了 B+ 树的叶子节点 上。也就是说,同一个叶子节点内的各个数据是按主键顺序存放的,因此,每当有一条新的 数据插入时,数据库会根据主键将其插入到对应的叶子节点中
如果我们使用自增主键,那么每次插入的新数据就会按顺序添加到当前索引节点的位置,不 需要移动已有的数据,当页面写满,就会自动开辟一个新页面。因为不需要重新移动数据, 因此这种插入数据的方法效率非常高。
如果我们使用非自增主键,由于每次插入主键的索引值都是随机的,因此每次插入新的数据 时,就可能会插入到现有数据页中间的某个位置,这将不得不移动其它数据来满足新数据的 插入,甚至需要从一个页面复制数据到另外一个页面,我们通常将这种情况称为页分裂。页 分裂还有可能会造成大量的内存碎片,导致索引结构不紧凑,从而影响查询效率。
因此,在使用 InnoDB 存储引擎时,如果没有特别的业务需求,建议使用自增字段作为主 键。
3. 前缀索引优化
前缀索引顾名思义就是使用某个字段中字符串的前几个字符建立索引,那我们为什么需要使 用前缀来建立索引呢?
我们知道,索引文件是存储在磁盘中的,而磁盘中最小分配单元是页,通常一个页的默认大 小为 16KB,假设我们建立的索引的每个索引值大小为 2KB,则在一个页中,我们能记录 8 个索引值,假设我们有 8000 行记录,则需要 1000 个页来存储索引。如果我们使用该索引 查询数据,可能需要遍历大量页,这显然会降低查询效率。
减小索引字段大小,可以增加一个页中存储的索引项,有效提高索引的查询速度。在一些大 字符串的字段作为索引时,使用前缀索引可以帮助我们减小索引项的大小。
不过,前缀索引是有一定的局限性的,例如 order by 就无法使用前缀索引,无法把前缀索 引用作覆盖索引
4. 防止索引失效
当我们习惯建立索引来实现查询 SQL 的性能优化后,是不是就万事大吉了呢?当然不是, 有时候我们看似使用到了索引,但实际上并没有被优化器选择使用。
对于 Hash 索引实现的列,如果使用到范围查询,那么该索引将无法被优化器使用到。也就 是说 Memory 引擎实现的 Hash 索引只有在“=”的查询条件下,索引才会生效。我们将order 表设置为 Memory 存储引擎,分析查询条件为 id<10 的 SQL,可以发现没有使用 到索引。
如果是以 % 开头的 LIKE 查询将无法利用节点查询数据:
当我们在使用复合索引时,需要使用索引中的最左边的列进行查询,才能使用到复合索引。 例如我们在 order 表中建立一个复合索引 idx_user_order_status(order_no, status, us er_id),如果我们使用 order_no、order_no+status、order_no+status+user_id 以及 order_no+user_id 组合查询,则能利用到索引;而如果我们用 status、status+user_id 查询,将无法使用到索引,这也是我们经常听过的最左匹配原则。
如果查询条件中使用 or,且 or 的前后条件中有一个列没有索引,那么涉及的索引都不会被 使用到
所以,你懂了吗?作为一名开发人员,如果没有熟悉 MySQL,特别是 MySQL 索引的基础 知识,很多时候都将被 DBA 批评到怀疑人生。
总结
在大多数情况下,我们习惯使用默认的 InnoDB 作为表存储引擎。在使用 InnoDB 作为存 储引擎时,创建的索引默认为 B+ 树数据结构,如果是主键索引,则属于聚族索引,非主键 索引则属于辅助索引。基于主键查询可以直接获取到行信息,而基于辅助索引作为查询条 件,则需要进行回表,然后再通过主键索引获取到数据。
如果只是查询一列或少部分列的信息,我们可以基于覆盖索引来避免回表。覆盖索引只需要 读取索引,且由于索引是顺序存储,对于范围或排序查询来说,可以极大地极少磁盘 I/O 操作。
除了了解索引的具体实现和一些特性,我们还需要注意索引失效的情况发生。如果觉得这些 规则太多,难以记住,我们就要养成经常检查 SQL 执行计划的习惯
部分3:什么时候需要分表分库?
在当今互联网时代,海量数据基本上是每一个成熟产品的共性,特别是在移动互联网产品 中,几乎每天都在产生数据,例如,商城的订单表、支付系统的交易明细以及游戏中的战报 等等。对于一个日活用户在百万数量级的商城来说,每天产生的订单数量可能在百万级,特别在一 些活动促销期间,甚至上千万。 假设我们基于单表来实现,每天产生上百万的数据量,不到一个月的时间就要承受上亿的数 据,这时单表的性能将会严重下降。因为 MySQL 在 InnoDB 存储引擎下创建的索引都是基于 B+ 树实现的,所以查询时的 I/O 次数很大程度取决于树的高度,随着 B+ 树的树高 增高,I/O 次数增加,查询性能也就越差。
当我们面对一张海量数据的表时,通常有分区、NoSQL 存储、分表分库等优化方案。
分区的底层虽然也是基于分表的原理实现的,即有多个底层表实现,但分区依然是在单库下 进行的,在一些需要提高并发的场景中的优化空间非常有限,且一个表最多只能支持 1024 个分区。面对日益增长的海量数据,优化存储能力有限。不过在一些非海量数据的大表中, 我们可以考虑使用分区来优化表性能。
分区表是由多个相关的底层表实现的,这些底层表也是由句柄对象表示,所 以我们也可以直接访问各个分区,存储引擎管理分区的各个底层表和管理普 通表一样(所有的底层表都必须使用相同的存储引擎),分区表的索引只是 在各个底层表上各自加上一个相同的索引,从存储引擎的角度来看,底层表 和一个普通表没有任何不同,存储引擎也无须知道这是一个普通表,还是一 个分区表的一部分。
而 NoSQL 存储是基于键值对存储,虽然查询性能非常高,但在一些方面仍然存在短板。例 如,不是关系型数据库,不支持事务以及稳定性方面相对 RDBMS 差一些。虽然有些 NoSQL 数据库也实现了事务,宣传具有可靠的稳定性,但目前 NoSQL 还是主要用作辅助 存储。
什么时候要分表分库?
分析完了分区、NoSQL 存储优化的应用,接下来我们就看看这讲的重头戏——分表分库。
在我看来,能不分表分库就不要分表分库。在单表的情况下,当业务正常时,我们使用单表 即可,而当业务出现了性能瓶颈时,我们首先考虑用分区的方式来优化,如果分区优化之后 仍然存在后遗症,此时我们再来考虑分表分库。
我们知道,如果在单表单库的情况下,当数据库表的数据量逐渐累积到一定的数量时 (5000W 行或 100G 以上),操作数据库的性能会出现明显下降,即使我们使用索引优化 或读写库分离,性能依然存在瓶颈。此时,如果每日数据增长量非常大,我们就应该考虑分 表,避免单表数据量过大,造成数据库操作性能下降。
面对海量数据,除了单表的性能比较差以外,我们在单表单库的情况下,数据库连接数、磁 盘 I/O 以及网络吞吐等资源都是有限的,并发能力也是有限的。所以,在一些大数据量且 高并发的业务场景中,我们就需要考虑分表分库来提升数据库的并发处理能力,从而提升应 用的整体性能
如何分表分库?
通常,分表分库分为垂直切分和水平切分两种。
垂直分库是指根据业务来分库,不同的业务使用不同的数据库。例如,订单和消费券在抢购 业务中都存在着高并发,如果同时使用一个库,会占用一定的连接数,所以我们可以将数据 库分为订单库和促销活动库。
而垂直分表则是指根据一张表中的字段,将一张表划分为两张表,其规则就是将一些不经常 使用的字段拆分到另一张表中。例如,一张订单详情表有一百多个字段,显然这张表的字段 太多了,一方面不方便我们开发维护,另一方面还可能引起跨页问题。这时我们就可以拆分 该表字段,解决上述两个问题。
水平分表则是将表中的某一列作为切分的条件,按照某种规则(Range 或 Hash 取模)来 切分为更小的表。
水平分表只是在一个库中,如果存在连接数、I/O 读写以及网络吞吐等瓶颈,我们就需要考 虑将水平切换的表分布到不同机器的库中,这就是水平分库分表了。
结合以上垂直切分和水平切分,我们一般可以将数据库分为:单库单表 - 单库多表 - 多库 多表。在平时的业务开发中,我们应该优先考虑单库单表;
如果数据量比较大,且热点数据 比较集中、历史数据很少访问,我们可以考虑表分区;
如果访问热点数据分散,基本上所有 的数据都会访问到,我们可以考虑单库多表;
如果并发量比较高、海量数据以及每日新增数 据量巨大,我们可以考虑多库多表。
这里还需要注意一点,我刚刚强调过,能不分表分库,就不要分表分库。这是因为一旦分 表,我们可能会涉及到多表的分页查询、多表的 JOIN 查询,从而增加业务的复杂度。而一 旦分库了,除了跨库分页查询、跨库 JOIN 查询,还会存在跨库事务的问题。这些问题无疑 会增加我们系统开发的复杂度。
分表分库之后面临的问题
然而,分表分库虽然存在着各种各样的问题,但在一些海量数据、高并发的业务中,分表分 库仍是最常用的优化手段。所以,我们应该充分考虑分表分库操作后所面临的一些问题,接 下我们就一起看看都有哪些应对之策。
为了更容易理解这些问题,我们将对一个订单表进行分库分表,通过详细的业务来分析这些 问题。
假设我们有一张订单表以及一张订单详情表,每天的数据增长量在 60W 单,平时还会有一 些促销类活动,订单增长量在千万单。为了提高系统的并发能力,我们考虑将订单表和订单 详情表做分库分表。除了分表,因为用户一般查询的是最近的订单信息,所以热点数据比较 集中,我们还可以考虑用表分区来优化单表查询。
通常订单的分库分表要么基于订单号 Hash 取模实现,要么根据用户 ID Hash 取模实现。 订单号 Hash 取模的好处是数据能均匀分布到各个表中,而缺陷则是一个用户查询所有订单 时,需要去多个表中查询。
由于订单表用户查询比较多,此时我们应该考虑使用用户 ID 字段做 Hash 取模,对订单表 进行水平分表。如果需要考虑高并发时的订单处理能力,我们可以考虑基于用户 ID 字段 Hash 取模实现分库分表。这也是大部分公司对订单表分库分表的处理方式。
1. 分布式事务问题
在提交订单时,除了创建订单之外,我们还需要扣除相应的库存。而订单表和库存表由于垂 直分库,位于不同的库中,这时我们需要通过分布式事务来保证提交订单时的事务完整性。 通常,我们解决分布式事务有两种通用的方式:两阶事务提交(2PC)以及补偿事务提交 (TCC)。有关分布式事务的内容,详细介绍。 通常有一些中间件已经帮我们封装好了这两种方式的实现,例如 Spring 实现的 JTA,目前 阿里开源的分布式事务中间件 Fescar,就很好地实现了与 Dubbo 的兼容。
2. 跨节点 JOIN 查询问题
用户在查询订单时,我们往往需要通过表连接获取到商品信息,而商品信息表可能在另外一 个库中,这就涉及到了跨库 JOIN 查询通常,我们会冗余表或冗余字段来优化跨库 JOIN 查询。对于一些基础表,例如商品信息 表,我们可以在每一个订单分库中复制一张基础表,避免跨库 JOIN 查询。而对于一两个字 段的查询,我们也可以将少量字段冗余在表中,从而避免 JOIN 查询,也就避免了跨库 JOIN 查询。
3. 跨节点分页查询问题
我们知道,当用户在订单列表中查询所有订单时,可以通过用户 ID 的 Hash 值来快速查询 到订单信息,而运营人员在后台对订单表进行查询时,则是通过订单付款时间来进行查询 的,这些数据都分布在不同的库以及表中,此时就存在一个跨节点分页查询的问题了。 通常一些中间件是通过在每个表中先查询出一定的数据,然后在缓存中排序后,获取到对应 的分页数据。这种方式在越往后面的查询,就越消耗性能。
通常我们建议使用两套数据来解决跨节点分页查询问题,一套是基于分库分表的用户单条或 多条查询数据,一套则是基于 Elasticsearch、Solr 存储的订单数据,主要用于运营人员根 据其它字段进行分页查询。为了不影响提交订单的业务性能,我们一般使用异步消息来实现 Elasticsearch、Solr 订单数据的新增和修改。
4. 全局主键 ID 问题
在分库分表后,主键将无法使用自增长来实现了,在不同的表中我们需要统一全局主键 ID。因此,我们需要单独设计全局主键,避免不同表和库中的主键重复问题。
使用 UUID 实现全局 ID 是最方便快捷的方式,即随机生成一个 32 位 16 进制数字,这种 方式可以保证一个 UUID 的唯一性,水平扩展能力以及性能都比较高。但使用 UUID 最大 的缺陷就是,它是一个比较长的字符串,连续性差,如果作为主键使用,性能相对来说会比 较差。
我们也可以基于 Redis 分布式锁实现一个递增的主键 ID,这种方式可以保证主键是一个整 数且有一定的连续性,但分布式锁存在一定的性能消耗。
我们还可以基于 Twitter 开源的分布式 ID 生产算法——snowflake 解决全局主键 ID 问 题,snowflake 是通过分别截取时间、机器标识、顺序计数的位数组成一个 long 类型的主 键 ID。这种算法可以满足每秒上万个全局 ID 生成,不仅性能好,而且低延时
5. 扩容问题
随着用户的订单量增加,根据用户 ID Hash 取模的分表中,数据量也在逐渐累积。此时, 我们需要考虑动态增加表,一旦动态增加表了,就会涉及到数据迁移问题。 我们在最开始设计表数据量时,尽量使用 2 的倍数来设置表数量。当我们需要扩容时,也 同样按照 2 的倍数来扩容,这种方式可以减少数据的迁移量。
总结
在业务开发之前,我们首先要根据自己的业务需求来设计表。考虑到一开始的业务发展比较 平缓,且开发周期比较短,因此在开发时间比较紧的情况下,我们尽量不要考虑分表分库。 但是我们可以将分表分库的业务接口预留,提前考虑后期分表分库的切分规则,把该冗余的 字段提前冗余出来,避免后期分表分库的 JOIN 查询等。
当业务发展比较迅速的时候,我们就要评估分表分库的必要性了。一旦需要分表分库,就要 结合业务提前规划切分规则,尽量避免消耗性能的跨表跨库 JOIN 查询、分页查询以及跨库 事务等操作
部分4:如何避免死锁?
之前我参与过一个项目,在项目初期,我们是没有将读写表分离的,而是基于一个主库完成 读写操作。在业务量逐渐增大的时候,我们偶尔会收到系统的异常报警信息,DBA 通知我 们数据库出现了死锁异常。
按理说业务开始是比较简单的,就是新增订单、修改订单、查询订单等操作,那为什么会出 现死锁呢?经过日志分析,我们发现是作为幂等性校验的一张表经常出现死锁异常。我们和 DBA 讨论之后,初步怀疑是索引导致的死锁问题。后来我们在开发环境中模拟了相关操 作,果然重现了该死锁异常
接下来我们就通过实战来重现下该业务死锁异常。首先,创建一张订单记录表,该表主要用 于校验订单重复创建:
CREATE TABLE `order_record` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`order_no` int(11) DEFAULT NULL,
`status` int(4) DEFAULT NULL,
`create_date` datetime(0) DEFAULT NULL,
PRIMARY KEY (`id`) USING BTREE,
INDEX `idx_order_status`(`order_no`,`status`) USING BTREE
) ENGINE = InnoDB
为了能重现该问题,我们先将事务设置为手动提交。这里要注意一下,MySQL 数据库和 Oracle 提交事务不太一样,MySQL 数据库默认情况下是自动提交事务,我们可以通过以 下命令行查看自动提交事务是否开启:
mysql> show variables like 'autocommit';
下面就操作吧,先将 MySQL 数据库的事务提交设置为手动提交,通过以下命令行可以关 闭自动提交事务:
mysql> set autocommit = 0;
订单在做幂等性校验时,先是通过订单号检查订单是否存在,如果不存在则新增订单记录。 知道具体的逻辑之后,我们再来模拟创建产生死锁的运行 SQL 语句。首先,我们模拟新建两个订单,并按照以下顺序执行幂等性校验 SQL 语句(垂直方向代表执行的时间顺序):
此时,我们会发现两个事务已经进入死锁状态。我们可以在 information_schema 数据库 中查询到具体的死锁情况,如下图所示:
看到这,你可能会想,为什么 SELECT 要加 for update 排他锁,而不是使用共享锁呢?试 想下,如果是两个订单号一样的请求同时进来,就有可能出现幻读。也就是说,一开始事务 A 中的查询没有该订单号,后来事务 B 新增了一个该订单号的记录,此时事务 A 再新增一条该订单号记录,就会创建重复的订单记录。面对这种情况,我们可以使用锁间隙算法来防 止幻读。
死锁是如何产生的?
上面我们说到了锁间隙,在部分1中,我已经讲过了并发事务中的锁机制以及行锁的具体 实现算法,不妨回顾一下。
行锁的具体实现算法有三种:record lock、gap lock 以及 next-key lock。record lock 是专门对索引项加锁;gap lock 是对索引项之间的间隙加锁;next-key lock 则是前面两 种的组合,对索引项以其之间的间隙加锁。
只在可重复读或以上隔离级别下的特定操作才会取得 gap lock 或 next-key lock,在 Select、Update 和 Delete 时,除了基于唯一索引的查询之外,其它索引查询时都会获取 gap lock 或 next-key lock,即锁住其扫描的范围。主键索引也属于唯一索引,所以主键 索引是不会使用 gap lock 或 next-key lock。
在 MySQL 中,gap lock 默认是开启的,即 innodb_locks_unsafe_for_binlog 参数值是 disable 的,且 MySQL 中默认的是 RR 事务隔离级别。
当我们执行以下查询 SQL 时,由于 order_no 列为非唯一索引,此时又是 RR 事务隔离级 别,所以 SELECT 的加锁类型为 gap lock,这里的 gap 范围是 (4,+∞)。
SELECT id FROM demo.order_record where order_no = 4 for update
执行查询 SQL 语句获取的 gap lock 并不会导致阻塞,而当我们执行以下插入 SQL 时,会 在插入间隙上再次获取插入意向锁。插入意向锁其实也是一种 gap 锁,它与 gap lock 是 冲突的,所以当其它事务持有该间隙的 gap lock 时,需要等待其它事务释放 gap lock 之 后,才能获取到插入意向锁。
以上事务 A 和事务 B 都持有间隙 (4,+∞)的 gap 锁,而接下来的插入操作为了获取到插 入意向锁,都在等待对方事务的 gap 锁释放,于是就造成了循环等待,导致死锁。
INSERT INTO demo.order_record(order_no, status, create_date) VALUES (5, 1, ‘2032-07-13 10:57:03’);
我们可以通过以下锁的兼容矩阵图,来查看锁的兼容性:
避免死锁的措施
知道了死锁问题源自哪儿,就可以找到合适的方法来避免它了。
避免死锁最直观的方法就是在两个事务相互等待时,当一个事务的等待时间超过设置的某一 阈值,就对这个事务进行回滚,另一个事务就可以继续执行了。这种方法简单有效,在 InnoDB 中,参数 innodb_lock_wait_timeout 是用来设置超时时间的。
另外,我们还可以将 order_no 列设置为唯一索引列。虽然不能防止幻读,但我们可以利用 它的唯一性来保证订单记录不重复创建,这种方式唯一的缺点就是当遇到重复创建订单时会 抛出异常。
我们还可以使用其它的方式来代替数据库实现幂等性校验。例如,使用 Redis 以及 ZooKeeper 来实现,运行效率比数据库更佳。
其它常见的 SQL 死锁问题
这里再补充一些常见的 SQL 死锁问题,以便你遇到时也能知道其原因,从而顺利解决。 我们知道死锁的四个必要条件:互斥、占有且等待、不可强占用、循环等待。只要系统发生 死锁,这些条件必然成立。所以在一些经常需要使用互斥共用一些资源,且有可能循环等待 的业务场景中,要特别注意死锁问题。
接下来,我们再来了解一个出现死锁的场景。
我们讲过,InnoDB 存储引擎的主键索引为聚簇索引,其它索引为辅助索引。如果使用辅助 索引来更新数据库,就需要使用聚簇索引来更新数据库字段。如果两个更新事务使用了不同 的辅助索引,或一个使用了辅助索引,一个使用了聚簇索引,就都有可能导致锁资源的循环 等待。由于本身两个事务是互斥,也就构成了以上死锁的四个必要条件了。
我们还是以上面的这个订单记录表来重现下聚簇索引和辅助索引更新时,循环等待锁资源导 致的死锁问题:
出现死锁的步骤:
综上可知,在更新操作时,我们应该尽量使用主键来更新表字段,这样可以有效避免一些不 必要的死锁发生。
总结
数据库发生死锁的概率并不是很大,一旦遇到了,就一定要彻查具体原因,尽快找出解决方 案,老实说,过程不简单。我们只有先对 MySQL 的 InnoDB 存储引擎有足够的了解,才 能剖析出造成死锁的具体原因。
例如,以上我例举的两种发生死锁的场景,一个考验的是我们对锁算法的了解,另外一个考 验则是我们对聚簇索引和辅助索引的熟悉程度。
解决死锁的最佳方式当然就是预防死锁的发生了,我们平时编程中,可以通过以下一些常规 手段来预防死锁的发生:
1. 在编程中尽量按照固定的顺序来处理数据库记录,假设有两个更新操作,分别更新两条 相同的记录,但更新顺序不一样,有可能导致死锁;
2. 在允许幻读和不可重复读的情况下,尽量使用 RC 事务隔离级别,可以避免 gap lock 导 致的死锁问题;
3. 更新表时,尽量使用主键更新;
4. 避免长事务,尽量将长事务拆解,可以降低与其它事务发生冲突的概率;
5. 设置锁等待超时参数,我们可以通过 innodb_lock_wait_timeout 设置合理的等待超时 阈值,特别是在一些高并发的业务中,我们可以尽量将该值设置得小一些,避免大量事务等 待,占用系统资源,造成严重的性能开销
部分5:数据库参数设置优化
MySQL 是一个灵活性比较强的数据库系统,提供了很多可配置参数,便于我们根据应用和 服务器硬件来做定制化数据库服务。如果现在让你回想,你可能觉得在开发的过程中很少去 调整 MySQL 的配置参数,但我今天想说的是我们很有必要去深入了解它们。 我们知道,数据库主要是用来存取数据的,而存取数据涉及到了磁盘 I/O 的读写操作,所 以数据库系统主要的性能瓶颈就是 I/O 读写的瓶颈了。
MySQL 数据库为了减少磁盘 I/O 的 读写操作,应用了大量内存管理来优化数据库操作,包括内存优化查询、排序以及写入操 作
也许你会想,我们把内存设置得越大越好,数据刷新到磁盘越快越好,不就对了吗?其实不 然,内存设置过大,同样会带来新的问题。例如,InnoDB 中的数据和索引缓存,如果设置 过大,就会引发 SWAP 页交换。还有数据写入到磁盘也不是越快越好,我们期望的是在高 并发时,数据能均匀地写入到磁盘中,从而避免 I/O 性能瓶颈。
SWAP 页交换:SWAP 分区在系统的物理内存不够用的时候,就会把物理内 存中的一部分空间释放出来,以供当前运行的程序使用。被释放的空间可能 来自一些很长时间没有什么操作的程序,这些被释放的空间的数据被临时保 存到 SWAP 分区中,等到那些程序要运行时,再从 SWAP 分区中恢复保存 的数据到内存中
所以,这些参数的设置跟我们的应用服务特性以及服务器硬件有很大的关系。MySQL 是一 个高定制化的数据库,我们可以根据需求来调整参数,定制性能最优的数据库。 不过想要了解这些参数的具体作用,我们先得了解数据库的结构以及不同存储引擎的工作原 理。
MySQL 体系结构
我们一般可以将 MySQL 的结构分为四层,最上层为客户端连接器,主要包括了数据库连 接、授权认证、安全管理等,该层引用了线程池,为接入的连接请求提高线程处理效率。
第二层是 Server 层,主要实现 SQL 的一些基础功能,包括 SQL 解析、优化、执行以及缓 存等,其中与我们这一讲主要相关的就是缓存。
第三层包括了各种存储引擎,主要负责数据的存取,这一层涉及到的 Buffer 缓存,也和这 一讲密切相关。
最下面一层是数据存储层,主要负责将数据存储在文件系统中,并完成与存储引擎的交互。
接下来我们再来了解下,当数据接收到一个 SQL 语句时,是如何处理的。
1. 查询语句
一个应用服务需要通过第一层的连接和授权认证,再将 SQL 请求发送至 SQL 接口。SQL 接口接收到请求之后,会先检查查询 SQL 是否命中 Cache 缓存中的数据,如果命中,则直 接返回缓存中的结果;否则,需要进入解析器。
解析器主要对 SQL 进行语法以及词法分析,之后,便会进入到优化器中,优化器会生成多 种执行计划方案,并选择最优方案执行。
确定了最优执行计划方案之后,执行器会检查连接用户是否有该表的执行权限,有则查看 Buffer 中是否存在该缓存,存在则获取锁,查询表数据;否则重新打开表文件,通过接口 调用相应的存储引擎处理,这时存储引擎就会进入到存储文件系统中获取相应的数据,并返 回结果集。
2. 更新语句
数据库更新 SQL 的执行流程其实跟查询 SQL 差不多,只不过执行更新操作的时候多了记录 日志的步骤。在执行更新操作时 MySQL 会将操作的日志记录到 binlog(归档日志)中, 这个步骤所有的存储引擎都有。而 InnoDB 除了要记录 binlog 之外,还需要多记录一个 redo log(重做日志)。
redo log 主要是为了解决 crash-safe 问题而引入的。我们知道,当数据库在存储数据时发 生异常重启,我们需要保证存储的数据要么存储成功,要么存储失败,也就是不会出现数据 丢失的情况,这就是 crash-safe 了。
我们在执行更新操作时,首先会查询相关的数据,之后通过执行器执行更新操作,并将执行 结果写入到内存中,同时记录更新操作到 redo log 的缓存中,此时 redo log 中的记录状 态为 prepare,并通知执行器更新完成,随时可以提交事务。执行器收到通知后会执行 binlog 的写入操作,此时的 binlog 是记录在缓存中的,写入成功后会调用引擎的提交事 务接口,更新记录状态为 commit。之后,内存中的 redo log 以及 binlog 都会刷新到磁 盘文件中。
内存调优
基于以上两个 SQL 执行过程,我们可以发现,在执行查询 SQL 语句时,会涉及到两个缓 存。第一个缓存是刚进来时的 Query Cache,它缓存的是 SQL 语句和对应的结果集。这里 的缓存是以查询 SQL 的 Hash 值为 key,返回结果集为 value 的键值对,判断一条 SQL 是否命中缓存,是通过匹配查询 SQL 的 Hash 值来实现的。 很明显,Query Cache 可以优化查询 SQL 语句,减少大量工作,特别是减少了 I/O 读取 操作。我们可以通过以下几个主要的设置参数来优化查询操作:
我们可以通过设置合适的 query_cache_min_res_unit 来减少碎片,这个参数最合适的大小 和应用程序查询结果的平均大小直接相关,可以通过以下公式计算所得:
(query_cache_size - Qcache_free_memory)/ Qcache_queries_in_cache
Qcache_free_memory 和 Qcache_queries_in_cache 的值可以通过以下命令查询:
show status like 'Qcache%'
Query Cache 虽然可以优化查询操作,但也仅限于不常修改的数据,如果一张表数据经常 进行新增、更新和删除操作,则会造成 Query Cache 的失效率非常高,从而导致频繁地清 除 Cache 中的数据,给系统增加额外的性能开销。 这也会导致缓存命中率非常低,我们可以通过以上查询状态的命令查看 Qcache_hits,该 值表示缓存命中率。如果缓存命中率特别低的话,我们还可以通过 query_cache_size = 0 或者 query_cache_type 来关闭查询缓存。 经过了 Query Cache 缓存之后,还会使用到存储引擎中的 Buffer 缓存。不同的存储引 擎,使用的 Buffer 也是不一样的。这里我们主要讲解两种常用的存储引擎。
1. MyISAM 存储引擎参数设置调优
MyISAM 存储引擎使用 key buffer 缓存索引块,MyISAM 表的数据块则没有缓存,它是 直接存储在磁盘文件中的。我们可以通过 key_buffer_size 设置 key buffer 缓存的大小,而它的大小并不是越大越 好。正如我前面所讲的,key buffer 缓存设置过大,实际应用却不大的话,就容易造成内 存浪费,而且系统也容易发生 SWAP 页交换,一般我是建议将服务器内存中可用内存的 1/4 分配给 key buffer。 如果要更准确地评估 key buffer 的设置是否合理,我们还可以通过缓存使用率公式来计 算:
1-((key_blocks_unused*key_cache_block_size)/key_buffer_size)
key_blocks_unused 表示未使用的缓存簇(blocks)数
key_cache_block_size 表示 key_buffer_size 被分割的区域大小
key_blocks_unused*key_cache_block_size 则表示剩余的可用缓存空间 (一般来说,缓存使用率在 80% 作用比较合适)。
2. InnoDB 存储引擎参数设置调优
InnoDB Buffer Pool(简称 IBP)是 InnoDB 存储引擎的一个缓冲池,与 MyISAM 存储引 擎使用 key buffer 缓存不同,它不仅存储了表索引块,还存储了表数据。查询数据时,IBP 允许快速返回频繁访问的数据,而无需访问磁盘文件。InnoDB 表空间缓存越多,MySQL 访问物理磁盘的频率就越低,这表示查询响应时间更快,系统的整体性能也有所提高。 我们一般可以通过多个设置参数来调整 IBP,优化 InnoDB 表性能。
innodb_buffer_pool_size
IBP 默认的内存大小是 128M,我们可以通过参数 innodb_buffer_pool_size 来设置 IBP 的大小,IBP 设置得越大,InnoDB 表性能就越好。但是,将 IBP 大小设置得过大也不好, 可能会导致系统发生 SWAP 页交换。所以我们需要在 IBP 大小和其它系统服务所需内存大 小之间取得平衡。MySQL 推荐配置 IBP 的大小为服务器物理内存的 80%。
我们也可以通过计算 InnoDB 缓冲池的命中率来调整 IBP 大小:
(1-innodb_buffer_pool_reads/innodb_buffer_pool_read_request)*100
但如果我们将 IBP 的大小设置为物理内存的 80% 以后,发现命中率还是很低,此时我们就 应该考虑扩充内存来增加 IBP 的大小。
innodb_buffer_pool_instances
InnoDB 中的 IBP 缓冲池被划分为了多个实例,对于具有数千兆字节的缓冲池的系统来说, 将缓冲池划分为单独的实例可以减少不同线程读取和写入缓存页面时的争用,从而提高系统 的并发性。该参数项仅在将 innodb_buffer_pool_size 设置为 1GB 或更大时才会生效。 在 windows 32 位操作系统中,如果 innodb_buffer_pool_size 的大小超过 1.3GB, innodb_buffer_pool_instances 默认大小就为 innodb_buffer_pool_size/128MB;否 则,默认为 1。 而在其它操作系统中,如果 innodb_buffer_pool_size 大小超过 1GB, innodb_buffer_pool_instances 值就默认为 8;否则,默认为 1。 为了获取最佳效率,建议指定 innodb_buffer_pool_instances 的大小,并保证每个缓冲池 实例至少有 1GB 内存。通常,建议 innodb_buffer_pool_instances 的大小不超过 innodb_read_io_threads + innodb_write_io_threads 之和,建议实例和线程数量比例为 1:1。
innodb_read_io_threads / innodb_write_io_threads
在默认情况下,MySQL 后台线程包括了主线程、IO 线程、锁线程以及监控线程等,其中 读写线程属于 IO 线程,主要负责数据库的读取和写入操作,这些线程分别读取和写入 innodb_buffer_pool_instances 创建的各个内存页面。MySQL 支持配置多个读写线程, 即通过 innodb_read_io_threads 和 innodb_write_io_threads 设置读写线程数量。 读写线程数量值默认为 4,也就是总共有 8 个线程同时在后台运行。 innodb_read_io_threads 和 innodb_write_io_threads 设置的读写线程数量,与 innodb_buffer_pool_instances 的大小有关,两者的协同优化是提高系统性能的一个关键 因素。
在一些内存以及 CPU 内核超大型的数据库服务器上,我们可以在保证足够大的 IBP 内存的 前提下,通过以下公式,协同增加缓存实例数量以及读写线程。
( innodb_read_io_threads + innodb_write_io_threads ) = innodb_buffe_pool_instances
如果我们仅仅是将读写线程根据缓存实例数量对半来分,即读线程和写线程各为实例大小的 一半,肯定是不合理的。例如我们的应用服务读取数据库的数据多于写入数据库的数据,那 么增加写入线程反而没有优化效果。我们一般可以通过 MySQL 服务器保存的全局统计信 息,来确定系统的读取和写入比率。
我们可以通过以下查询来确定读写比率:
SHOW GLOBAL STATUS LIKE 'Com_select';// 读取数量
SHOW GLOBAL STATUS WHERE Variable_name IN ('Com_insert', 'Com_update', 'Com_replace', 'C
如果读大于写,我们应该考虑将读线程的数量设置得大一些,写线程数量小一些;否则,反 之。
innodb_log_file_size
除了以上 InnoDB 缓存等因素之外,InnoDB 的日志缓存大小、日志文件大小以及日志文件 持久化到磁盘的策略都影响着 InnnoDB 的性能。 InnoDB 中有一个 redo log 文件, InnoDB 用它来存储服务器处理的每个写请求的重做活动。执行的每个写入查询都会在日志 文件中获得重做条目,以便在发生崩溃时可以恢复更改。 当日志文件大小已经超过我们参数设置的日志文件大小时,InnoDB 会自动切换到另外一个 日志文件,由于重做日志是一个循环使用的环,在切换时,就需要将新的日志文件脏页的缓 存数据刷新到磁盘中(触发检查点)。 理论上来说,innodb_log_file_size 设置得越大,缓冲池中需要的检查点刷新活动就越少, 从而节省磁盘 I/O。那是不是将这个日志文件设置得越大越好呢?如果日志文件设置得太大,恢复时间就会变长,这样不便于 DBA 管理。在大多数情况下,我们将日志文件大小设 置为 1GB 就足够了。
innodb_log_buffer_size
这个参数决定了 InnoDB 重做日志缓冲池的大小,默认值为 8MB。如果高并发中存在大量 的事务,该值设置得太小,就会增加写入磁盘的 I/O 操作。我们可以通过增大该参数来减 少写入磁盘操作,从而提高并发时的事务性能。
innodb_flush_log_at_trx_commit
这个参数可以控制重做日志从缓存写入文件刷新到磁盘中的策略,默认值为 1。 当设置该参数为 0 时,InnoDB 每秒种就会触发一次缓存日志写入到文件中并刷新到磁盘 的操作,这有可能在数据库崩溃后,丢失 1s 的数据。 当设置该参数为 1 时,则表示每次事务的 redo log 都会直接持久化到磁盘中,这样可以保 证 MySQL 异常重启之后数据不会丢失。 当设置该参数为 2 时,每次事务的 redo log 都会直接写入到文件中,再将文件刷新到磁 盘。 在一些对数据安全性要求比较高的场景中,显然该值需要设置为 1;而在一些可以容忍数据 库崩溃时丢失 1s 数据的场景中,我们可以将该值设置为 0 或 2,这样可以明显地减少日志 同步到磁盘的 I/O 操作。
总结
MySQL 数据库的参数设置非常多,今天我们仅仅是了解了与内存优化相关的参数设置。除 了这些参数设置,我们还有一些常用的提高 MySQL 并发的相关参数设置,总结如下:
部分5.1:MySQL中InnoDB的知识点串讲
今天我们一起串下 MySQL 中 InnoDB 的知识点。InnoDB 存储引擎作为我们最常用到的存储引擎之一,充分熟悉它的的实现和运 行原理,有助于我们更好地创建和维护数据库表。
InnoDB 体系架构
InnoDB 主要包括了内存池、后台线程以及存储文件。内存池又是由多个内存块组成的,主 要包括缓存磁盘数据、redo log 缓冲等;后台线程则包括了 Master Thread、IO Thread 以及 Purge Thread 等;由 InnoDB 存储引擎实现的表的存储结构文件一般包括表结构文件(.frm)、共享表空间文件(ibdata1)、独占表空间文件(ibd)以及日志文件(redo 文件等)等。
1. 内存池
我们知道,如果客户端从数据库中读取数据是直接从磁盘读取的话,无疑会带来一定的性能 瓶颈,缓冲池的作用就是提高整个数据库的读写性能。 客户端读取数据时,如果数据存在于缓冲池中,客户端就会直接读取缓冲池中的数据,否则 再去磁盘中读取;对于数据库中的修改数据,首先是修改在缓冲池中的数据,然后再通过 Master Thread 线程刷新到磁盘上。
理论上来说,缓冲池的内存越大越好。我们在部分5中详细讲过了缓冲池的大小配置方式 以及调优。
缓冲池中不仅缓存索引页和数据页,还包括了 undo 页,插入缓存、自适应哈希索引以及 InnoDB 的锁信息等等。
InnoDB 允许多个缓冲池实例,从而减少数据库内部资源的竞争,增强数据库的并发处理能 力,部分5还讲到了缓冲池实例的配置以及调优
InnoDB 存储引擎会先将重做日志信息放入到缓冲区中,然后再刷新到重做日志文件中。
2. 后台线程
Master Thread 主要负责将缓冲池中的数据异步刷新到磁盘中,除此之外还包括插入缓 存、undo 页的回收等,IO Thread 是负责读写 IO 的线程,而 Purge Thread 主要用于回 收事务已经提交了的 undo log,Pager Cleaner Thread 是新引入的一个用于协助 Master Thread 刷新脏页到磁盘的线程,它可以减轻 Master Thread 的工作压力,减少阻塞。
3. 存储文件
在 MySQL 中建立一张表都会生成一个.frm 文件,该文件是用来保存每个表的元数据信息 的,主要包含表结构定义。 在 InnoDB 中,存储数据都是按表空间进行存放的,默认为共享表空间,存储的文件即为 共享表空间文件(ibdata1)。若设置了参数 innodb_file_per_table 为 1,则会将存储的 数据、索引等信息单独存储在一个独占表空间,因此也会产生一个独占表空间文件 (ibd)。如果你对共享表空间和独占表空间的理解还不够透彻,接下来我会详解。 而日志文件则主要是重做日志文件,主要记录事务产生的重做日志,保证事务的一致性。
InnoDB 逻辑存储结构
InnoDB 逻辑存储结构分为表空间(Tablespace)、段 (Segment)、区 (Extent)、页 Page) 以及行 (row)
1. 表空间(Tablespace)
InnoDB 提供了两种表空间存储数据的方式,一种是共享表空间,一种是独占表空间。 InnoDB 默认会将其所有的表数据存储在一个共享表空间中,即 ibdata1。 我们可以通过设置 innodb_file_per_table 参数为 1(1 代表独占方式)开启独占表空间模 式。开启之后,每个表都有自己独立的表空间物理文件,所有的数据以及索引都会存储在该 文件中,这样方便备份以及恢复数据。
2. 段 (Segment)
表空间是由各个段组成的,段一般分为数据段、索引段和回滚段等。我们知道,InnoDB 默 认是基于 B + 树实现的数据存储。 这里的索引段则是指的 B + 树的非叶子节点,而数据段则是 B + 树的叶子节点。而回滚段 则指的是回滚数据,之前我们在讲事务隔离的时候就介绍到了 MVCC 利用了回滚段实现了 多版本查询数据。
3. 区 (Extent) / 页(Page)
区是表空间的单元结构,每个区的大小为 1MB。而页是组成区的最小单元,页也是 InnoDB 存储引擎磁盘管理的最小单元,每个页的大小默认为 16KB。为了保证页的连续 性,InnoDB 存储引擎每次从磁盘申请 4-5 个区。
4. 行(Row)
InnoDB 存储引擎是面向列的(row-oriented),也就是说数据是按行进行存放的,每个页 存放的行记录也是有硬性定义的,最多允许存放 16KB/2-200 行,即 7992 行记录。
InnoDB 事务之 redo log 工作原理
InnoDB 是一个事务性的存储引擎,而 InnoDB 的事务实现是基于事务日志 redo log 和 undo log 实现的。redo log 是重做日志,提供再写入操作,实现事务的持久性;undo log 是回滚日志,提供回滚操作,保证事务的一致性。
redo log 又包括了内存中的日志缓冲(redo log buffer)以及保存在磁盘的重做日志文件 (redo log file),前者存储在内存中,容易丢失,后者持久化在磁盘中,不会丢失。
InnoDB 的更新操作采用的是 Write Ahead Log 策略,即先写日志,再写入磁盘。当一条 记录更新时,InnoDB 会先把记录写入到 redo log buffer 中,并更新内存数据。我们可以 通过参数 innodb_flush_log_at_trx_commit 自定义 commit 时,如何将 redo log buffer 中的日志刷新到 redo log file 中。
在这里,我们需要注意的是 InnoDB 的 redo log 的大小是固定的,分别有多个日志文件采 用循环方式组成一个循环闭环,当写到结尾时,会回到开头循环写日志。我们可以通过参数 innodb_log_files_in_group 和 innodb_log_file_size 配置日志文件数量和每个日志文件的 大小。
Buffer Pool 中更新的数据未刷新到磁盘中,该内存页我们称之为脏页。最终脏页的数据会 刷新到磁盘中,将磁盘中的数据覆盖,这个过程与 redo log 不一定有关系。
只有当 redo log 日志满了的情况下,才会主动触发脏页刷新到磁盘,而脏页不仅只有 redo log 日志满了的情况才会刷新到磁盘,以下几种情况同样会触发脏页的刷新:
系统内存不足时,需要将一部分数据页淘汰掉,如果淘汰的是脏页,需要先将脏页同步到 磁盘
MySQL 认为空闲的时间,这种情况没有性能问题;
MySQL 正常关闭之前,会把所有的脏页刷入到磁盘,这种情况也没有性能问题。
在生产环境中,如果我们开启了慢 SQL 监控,你会发现偶尔会出现一些用时稍长的 SQL。 这是因为脏页在刷新到磁盘时可能会给数据库带来性能开销,导致数据库操作抖动。
LRU 淘汰策
以上我们了解了 InnoDB 的更新和插入操作的具体实现原理,接下来我们再来了解下读的 实现和优化方式。 InnoDB 存储引擎是基于集合索引实现的数据存储,也就是除了索引列以及主键是存储在 B + 树之外,其它列数据也存储在 B + 树的叶子节点中。而这里的索引页和数据页都会缓存 在缓冲池中,在查询数据时,只要在缓冲池中存在该数据,InnoDB 就不用每次都去磁盘中 读取页,从而提高数据库的查询性能。 虽然缓冲池是一个很大的内存区域,但由于存放了各种类型的数据,加上存储数据量之大, 缓冲池无法将所有的数据都存储在其中。因此,缓冲池需要通过 LRU 算法将最近且经常查 询的数据缓存在其中,而不常查询的数据就淘汰出去。 InnoDB 对 LRU 做了一些优化,我们熟悉的 LRU 算法通常是将最近查询的数据放到 LRU 列表的首部,而 InnoDB 则是将数据放在一个 midpoint 位置,通常这个 midpoint 为列 表长度的 5/8。 这种策略主要是为了避免一些不常查询的操作突然将热点数据淘汰出去,而热点数据被再次 查询时,需要再次从磁盘中获取,从而影响数据库的查询性能。 如果我们的热点数据比较多,我们可以通过调整 midpoint 值来增加热点数据的存储量,从 而降低热点数据的淘汰率。
总结
以上 InnoDB 的实现和运行原理到这里就介绍完了。回顾模块六,前三讲我主要介绍了数 据库操作的性能优化,包括 SQL 语句、事务以及索引的优化,接下来我又讲到了数据库表 优化,包括表设计、分表分库的实现等等,最后我还介绍了一些数据库参数的调优。 总的来讲,作为开发工程师,我们应该掌握数据库几个大的知识点,然后再深入到数据库内 部实现的细节,这样才能避免经常写出一些具有性能问题的 SQL,培养调优数据库性能的 能力
部分6:电商系统表设计优化案例分析
如果在业务架构设计初期,表结构没有设计好,那么后期随着业务以及数据量的增多,系统 就很容易出现瓶颈。如果表结构扩展性差,业务耦合度将会越来越高,系统的复杂度也将随 之增加。这一讲我将以电商系统中的表结构设计为例,为你详讲解在设计表时,我们都需要 考虑哪些因素,又是如何通过表设计来优化系统性能。
核心业务
要懂得一个电商系统的表结构设计,我们必须先得熟悉一个电商系统中都有哪些基本核心业 务。这部分的内容,只要你有过网购经历,就很好理解
一般电商系统分为平台型和自营型电商系统。平台型电商系统是指有第三方商家入驻的电商 平台,第三方商家自己开设店铺来维护商品信息、库存信息、促销活动、客服售后等,典型 的代表有淘宝、天猫等。而自营型电商系统则是指没有第三方商家入驻,而是公司自己运营 的电商平台,常见的有京东自营、苹果商城等。
两种类型的电商系统比较明显的区别是卖家是 C 端还是 B 端,很显然,平台型电商系统的 复杂度要远远高于自营型电商系统。为了更容易理解商城的业务,我们将基于自营型电商系 统来讨论表结构设计优化,这里以苹果商城为例
一个电商系统的核心业务肯定就是销售商品了,围绕销售商品,我们可以将核心业务分为以 下几个主要模块:
1. 商品模块
商品模块主要包括商品分类以及商品信息管理,商品分类则是我们常见的大分类了,有人喜 欢将分类细化为多个层级,例如,第一个大类是手机、电视、配件等,配件的第二个大类又 分为耳机、充电宝等。为了降低用户学习系统操作的成本,我们应该尽量将层级减少。 当我们通过了分类查询之后,就到了商品页面,一个商品 Item 包含了若干商品 SKU。商 品 Item 是指一种商品,例如 IPhone9,就是一个 Item,商品 SKU 则是指具体属性的商 品,例如金色 128G 内存的 IPhone9。
2. 购物车模块
购物车主要是用于用户临时存放欲购买的商品,并可以在购物车中统一下单结算。购物车一 般分为离线购物车和在线购物车。离线购物车则是用户选择放入到购物车的商品只保存在本 地缓存中,在线购物车则是会同步这些商品信息到服务端。 目前大部分商城都是支持两种状态的购物车,当用户没有登录商城时,主要是离线购物车在 记录用户的商品信息,当用户登录商城之后,用户放入到购物车中的商品都会同步到服务 端,以后在手机和电脑等不同平台以及不同时间都能查看到自己放入购物车的商品。
3. 订单模块
订单是盘活整个商城的核心功能模块,如果没有订单的产出,平台将难以维持下去。订单模 块管理着用户在平台的交易记录,是用户和商家交流购买商品状态的渠道,用户可以随时更改一个订单的状态,商家则必须按照业务流程及时订单的更新状态,告知用户已购买商品的 具体状态。
通常一个订单分为以下几个状态:待付款、待发货、待收货、待评价、交易完成、用户取 消、仅退款、退货退款状态。一个订单的流程见下图:
4. 库存模块
这里主要记录的是商品 SKU 的具体库存信息,主要功能包括库存交易、库存管理。库存交 易是指用户购买商品时实时消费库存,库存管理主要包括运营人员对商品的生产或采购入 库、调拨。
一般库存信息分为商品 SKU、仓区、实时库存、锁定库存、待退货库存、活动库存。
现在大部分电商都实现了华南华北的库存分区,所以可能存在同一个商品 SKU 在华北没有 库存,而在华南存在库存的情况,所以我们需要有仓区这个字段,用来区分不同地区仓库的 同一个商品 SKU。
实时库存则是指商品的实时库存,锁定库存则表示用户已经提交订单到实际扣除库存或订单 失效的这段时间里锁定的库存,待退货库存、活动库存则分别表表示订单退款时的库存数量 以及每次活动时的库存数量。 除了这些库存信息,我们还可以为商品设置库存状态,例如虚拟库存状态、实物库存状态。 如果一个商品不需要设定库存,可以任由用户购买,我们则不需要在每次用户购买商品时都 去查询库存、扣除库存,只需要设定商品的库存状态为虚拟库存即可
5. 促销活动模块
促销活动模块是指消费券、红包以及满减等促销功能,这里主要包括了活动管理和交易管 理。前者主要负责管理每次发放的消费券及红包有效期、金额、满足条件、数量等信息,后 者则主要负责管理用户领取红包、消费券等信息。
业务难点
了解了以上那些主要模块的具体业务之后,我们就可以更深入地去评估从业务落实到系统实 现,可能存在的难点以及性能瓶颈了。
1. 不同商品类别存在差异,如何设计商品表结构?
我们知道,一个手机商品的详细信息跟一件衣服的详细信息差别很大,手机的 SKU 包括了 颜色、运行内存、存储内存等,而一件衣服则包含了尺码、颜色。
如果我们需要将这些商品都存放在一张表中,要么就使用相同字段来存储不同的信息,要么 就新增字段来维护各自的信息。前者会导致程序设计复杂化、表宽度大,从而减少磁盘单页 存储行数,影响查询性能,且维护成本高;后者则会导致一张表中字段过多,如果有新的商 品类型出现,又需要动态添加字段。
比较好的方式是通过一个公共表字段来存储一些具有共性的字段,创建单独的商品类型表, 例如手机商品一个表、服饰商品一个表。但这种方式也有缺点,那就是可能会导致表非常 多,查询商品信息的时候不够灵活,不好实现全文搜索。
这时候,我们可以基于一个公共表来存储商品的公共信息,同时结合搜索引擎,将商品详细 信息存储到键值对数据库,例如 ElasticSearch、Solr 中。
2. 双十一购物车商品数量大增,购物车系统出现性能瓶颈怎么办?
在用户没有登录系统的情况下,我们是通过 cookie 来保存购物车的商品信息,而在用户登 录系统之后,购物车的信息会保存到数据库中。
在双十一期间,大部分用户都会提前将商品加入到购物车中,在加入商品到购物车的这段操 作中,由于时间比较长,操作会比较分散,所以对数据库的写入并不会造成太大的压力。但 在购买时,由于多数属于抢购商品,用户对购物车的访问则会比较集中了,如果都去数据库 中读取,那么数据库的压力就可想而知了
此时我们应该考虑冷热数据方案来存储购物车的商品信息,用户一般都会首选最近放入购物 车的商品,这些商品信息则是热数据,而较久之前放入购物车中的商品信息则是冷数据,我 们需要提前将热数据存放在 Redis 缓存中,以便提高系统在活动期间的并发性能。例如, 可以将购物车中近一个月的商品信息都存放到 Redis 中,且至少为一个分页的信息。
当在缓存中没有查找到购物车信息时,再去数据库中查询,这样就可以大大降低数据库的压 力。
3. 订单表海量数据,如何设计订单表结构?
通常我们的订单表是系统数据累计最快的一张表,无论订单是否真正付款,只要订单提交了 就会在订单表中创建订单。如果公司的业务发展非常迅速,那么订单表的分表分库就只是迟 早的事儿了。
在没有分表之前,订单的主键 ID 都是自增的,并且关联了一些其它业务表。一旦要进行分 表分库,就会存在主键 ID 与业务耦合的情况,而且分表后新自增 ID 与之前的 ID 也可能会 发生冲突,后期做表升级的时候我们将会面临巨大的工作量。如果我们确定后期做表升级, 建议提前使用 snowflake 来生成主键 ID。
如果订单表要实现水平分表,那我们基于哪个字段来实现分表呢?
通常我们是通过计算用户 ID 字段的 Hash 值来实现订单的分表,这种方式可以优化用户购 买端对订单的操作性能。如果我们需要对订单表进行水平分库,那就还是基于用户 ID 字段 来实现。
在分表分库之后,对于我们的后台订单管理系统来说,查询订单就是一个挑战了。通常后台 都是根据订单状态、创建订单时间进行查询的,且需要支持分页查询以及部分字段的 JOIN 查询,如果需要在分表分库的情况下进行这些操作,无疑是一个巨大的挑战了。
对于 JOIN 查询,我们一般可以通过冗余一些不常修改的配置表来实现。例如,商品的基础 信息,我们录入之后很少修改,可以在每个分库中冗余该表,如果字段信息比较少,我们可 以直接在订单表中冗余这些字段。
而对于分页查询,通常我们建议冗余订单信息到大数据中。后台管理系统通过大数据来查询 订单信息,用户在提交订单并且付款之后,后台将会同步这条订单到大数据。用户在 C 端修改或运营人员在后台修改订单时,会通过异步方式通知大数据更新该订单数据,这种方式 可以解决分表分库后带来的分页查询问题。
4. 抢购业务,如何解决库存表的性能瓶颈?
在平时购买商品时,我们一般是直接去数据库检查、锁定库存,但如果是在促销活动期间抢 购商品,我们还是直接去数据库检查、更新库存的话,面对高并发,系统无疑会产生性能瓶 颈。 一般我们会将促销活动的库存更新到缓存中,通过缓存来查询商品的实时库存,并且通过分 布式锁来实现库存扣减、锁定库存。分布式锁的具体实现,
5. 促销活动也存在抢购场景,如何设计表?
促销活动中的优惠券和红包交易,很多时候跟抢购活动有些类似。 在一些大型促销活动之前,我们一般都会定时发放各种商品的优惠券和红包,用户需要点击 领取才能使用。所以在一定数量的优惠券和红包放出的同时,也会存在同一时间抢购这些优 惠券和红包的情况,特别是一些热销商品。 我们可以参考库存的优化设计方式,使用缓存和分布式锁来查询、更新优惠券和红包的数 量,通过缓存获取数量成功以后,再通过异步方式更新数据库中优惠券和红包的数量。
总结
这一讲,我们结合电商系统实战练习了如何进行表设计,可以总结为以下几个要点: 在字段比较复杂、易变动、不方便统一的情况下,建议使用键值对来代替关系数据库表存 储; 在高并发情况下的查询操作,可以使用缓存代替数据库操作,提高并发性能; 数据量叠加比较快的表,需要考虑水平分表或分库,避免单表操作的性能瓶颈; 除此之外,我们应该通过一些优化,尽量避免比较复杂的 JOIN 查询操作,例如冗余一些 字段,减少 JOIN 查询;创建一些中间表,减少 JOIN 查询