mysql
[事务,隔离级别,存储引擎,索引等]
事务
什么是事务
事务是应用程序中一系列严密的操作,所有操作必须成功完成,否则在每个操作中所作的所有更改都会被撤消。也就是事务具有原子性,一个事务中的一系列的操作要么全部成功,要么一个都不做。
事务的结束有两种,当事务中的所以步骤全部成功执行时,事务提交。如果其中一个步骤失败,将发生回滚操作,撤消撤消之前到事务开始时的所以操作。
事务的ACID
事务具有四个特征:原子性( Atomicity )、一致性( Consistency )、隔离性( Isolation )和持久性( Durability )。这四个特性简称为 ACID 特性。
- 原子性。事务是数据库的逻辑工作单位,事务中包含的各操作要么都做,要么都不做
- 一致性。事 务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。因此当数据库只包含成功事务提交的结果时,就说数据库处于一致性状态。如果数据库系统 运行中发生故障,有些事务尚未完成就被迫中断,这些未完成事务对数据库所做的修改有一部分已写入物理数据库,这时数据库就处于一种不正确的状态,或者说是 不一致的状态。
- 隔离性。一个事务的执行不能其它事务干扰。即一个事务内部的操作及使用的数据对其它并发事务是隔离的,并发执行的各个事务之间不能互相干扰。
- 持久性。指一个事务一旦提交,它对数据库中的数据的改变就应该是永久性的。接下来的其它操作或故障不应该对其执行结果有任何影响。
隔离级别
SQL标准定义了4类隔离级别,包括了一些具体规则,用来限定事务内外的哪些改变是可见的,哪些是不可见的。低级别的隔离级一般支持更高的并发处理,并拥有更低的系统开销。
四种隔离级别
- Read Uncommitted(读取未提交内容)
在该隔离级别,所有事务都可以看到其他未提交事务的执行结果。本隔离级别很少用于实际应用,因为它的性能也不比其他级别好多少。读取未提交的数据,也被称之为脏读(Dirty Read)。 - Read Committed(读取提交内容)
这是大多数数据库系统的默认隔离级别(但不是MySQL默认的)。它满足了隔离的简单定义:一个事务只能看见已经提交事务所做的改变。这种隔离级别 也支持所谓的不可重复读(Nonrepeatable Read),因为同一事务的其他实例在该实例处理其间可能会有新的commit,所以同一select可能返回不同结果。 - Repeatable Read(可重读)
这是MySQL的默认事务隔离级别,它确保同一事务的多个实例在并发读取数据时,会看到同样的数据行。不过理论上,这会导致另一个棘手的问题:幻读 (Phantom Read)。简单的说,幻读指当用户读取某一范围的数据行时,另一个事务又在该范围内插入了新行,当用户再读取该范围的数据行时,会发现有新的“幻影” 行。InnoDB和Falcon存储引擎通过多版本并发控制(MVCC,Multiversion Concurrency Control)机制解决了该问题。 - Serializable(可串行化)
这是最高的隔离级别,它通过强制事务排序,使之不可能相互冲突,从而解决幻读问题。简言之,它是在每个读的数据行上加上共享锁。在这个级别,可能导致大量的超时现象和锁竞争。
脏读,不可重复读,幻读
- 脏读(Drity Read)
某个事务已更新一份数据,另一个事务在此时读取了同一份数据,由于某些原因,前一个RollBack了操作,则后一个事务所读取的数据就会是不正确的。 - 不可重复读(Non-repeatable read)
在一个事务的两次查询之中数据不一致,这可能是两次查询过程中间插入了一个事务更新的原有的数据。 - 幻读(Phantom Read)
在一个事务的两次查询中数据笔数不一致,例如有一个事务查询了几列(Row)数据,而另一个事务却在此时插入了新的几列数据,先前的事务在接下来的查询中,就会发现有几列数据是它先前所没有的。
这四种隔离级别,分别有可能产生问题如下所示:
隔离级别 | 脏读 | 不可重复读 | 幻读 |
Read Uncommitted | √ | √ | √ |
Read Committed(RC) | × | √ | √ |
Repeatable Read(RR) | × | × | √ |
Serializable | × | × | × |
MVCC(多版本并发控制)
mysql的innodb采用的是行锁,而且采用了多版本并发控制来提高读操作的性能。
其实就是在每一行记录的后面增加两个隐藏列,记录创建版本号和删除版本号,
而每一个事务在启动的时候,都有一个唯一的递增的版本号。
举个栗子:
- Insert
比如插入一条记录, 事务id是1 ,那么记录如下,记录的创建版本号就是事务版本号。
insert into table values (1, ‘test’);
id(主键) | name(name) | create version(创建版本号) | delete version(删除版本号) |
1 | test | 1 |
- Update
采用的是先标记旧的那行记录为已删除,并且删除版本号是事务版本号,然后插入一行新的记录的方式。
针对上面那行记录,事务Id为2 要把name字段更新。
update table set name= ‘new_value’ where id=1;
id(主键) | name(name) | create version(创建版本号) | delete version(删除版本号) |
1 | test | 1 | 2 |
1 | new_value | 2 |
- Delete
就把事务版本号作为删除版本号。
delete from table where id=1;
id(主键) | name(name) | create version(创建版本号) | delete version(删除版本号) |
1 | new_value | 2 | 3 |
- Select
查询时要符合以下两个条件的记录才能被事务查询出来:
1) 删除版本号大于当前事务版本号,就是说删除操作是在当前事务启动之后做的。
2) 创建版本号小于或者等于当前事务版本号,就是说记录创建是在事务中(等于的情况)或者事务启动之前。
保证了各个事务互不影响。从这里也可以体会到一种提高系统性能的思路就是: 通过版本号来减少锁的争用。
另外,只有read-committed和 repeatable-read 两种事务隔离级别才能使用MVCC
read-uncommited由于是读到未提交的,所以不存在版本的问题
而serializable 则会对所有读取的行加锁。
存储引擎
此处只列举两种,MyISAM 与 InnoDb
InnoDb
- 支持ACID的事务,支持事务的四种隔离级别;
- 支持行级锁及外键约束:因此可以支持写并发;
- 不存储总行数;
- 一个InnoDb引擎存储在一个文件空间(共享表空间,表大小不受操作系统控制,一个表可能分布在多个文件里),也有可能为多个(设置为独立表空,表大小受操作系统文件大小限制,一般为2G),受操作系统文件大小的限制;
- 主键索引采用聚集索引(索引的数据域存储数据文件本身),辅索引的数据域存储主键的值;因此从辅索引查找数据,需要先通过辅索引找到主键值,再访问辅索引;最好使用自增主键,防止插入数据时,为维持B+树结构,文件的大调整。
MyISAM
- 不支持事务,但是每次查询都是原子的;
- 支持表级锁,即每次操作是对整个表加锁;
- 存储表的总行数;
- 一个MYISAM表有三个文件:索引文件、表结构文件、数据文件;
- 采用非聚集索引,索引文件的数据域存储指向数据文件的指针。辅索引与主索引基本一致,但是辅索引不用保证唯一性。
索引相关
mysql索引类型:
normal - 普通索引
unique - 唯一索引:表示唯一的,不允许重复的索引,如果该字段信息保证不会重复例如身份证号用作
索引时,可设置为unique
fulltext - 全文索引:表示 全文搜索的索引。 FULLTEXT 用于搜索很长一篇文章的时候,效果最好。
用在比较短的文本,如果就一两行字的,普通的 INDEX 也可以。
spatial - 空间索引
mysql索引方法:b-tree,hash
聚合索引和非聚合索引:
innodb引擎的数据表一般是有且只有一个聚合索引,如果这张表有主键,那么主键这个字段就会被
当做聚合索引,如果没有主键,那就会把这张表由左而右的第一个唯一索引当做聚合索引,如果既
没有主键有没有唯一索引,那么mysql会自动创建一个名字为‘gen_clust_index’的隐藏字段当作
聚合索引
MySQL的行锁是基于什么的?
是基于索引的,因此加了索引的字段一定不能为null,否则修改时行锁会升级成表锁,进而导致锁表;
一般建议一张表不要建太多索引,因为会影响添加和修改的效率。
面试问题
1.MySQL中,char和varchar的区别是什么?
char和varchar都是用来存储字符串的,但是他们保持和检索的方式不同。
char是属于固定长度的字符类型,而varchar是属于可变长度的字符类型。
由于char是固定长度的所以它的处理速度比varchar快很多。但是缺点是浪费存储空间,读取char类型数据时候时如果尾部有空格会丢失空格,所以对于那种长度变化不大的并且对查询速度有较高要求的数据可以考虑使用char类型来存储。
另外随着MySQL版本的不断升级,varchar数据类型的性能也在不断改进并提高,所以在许多的应用中,varchar类型被更多的使用
不同的存储引擎对char和varchar的使用原则有所不同:
MyISAM存储引擎:建议使用固定长度的数据列代替可变长度的数据列。
MEMORY存储引擎:目前都使用固定长度的数据行存储,因此无论使用CHAR或VARCHAR列都没有关系。两者都是
作为CHAR类型处理。
InnoDB存储引擎:建议使用VARCHAR类型。对于InnoDB数据表,内部的行存储格式没有区分固定长度和可变长度
列(所有数据行都使用指向数据列值的头指针),因此在本质上,使用固定长度的CHAR列不一定
比使用可变长度VARCHAR列性能要好。因而,主要的性能因素是数据行使用的存储总量。由于
CHAR平均占用的空间多于VARCHAR,因此使用VARCHAR来最小化需要处理的数据行的存储总量
和磁盘I/O是比较好的。
。
。
。
*觉得有用可以关注博主哦,如果再不能相遇,祝你早午晚都安。。。