主键约束(Primary Key):
什么是主键:在一张表的字段中,必须定义一个字段为该表的主键,是每一行记录的唯一标识!
任何一张表都应该有主键,没有主键表无效!
外键约束(fireugn key):
什么是外键:在一张表的字段中,有太多相同的数据,产生大量冗余,我们为了节省数据库的内存空间,把一张表设计成两张表,用一张表的外键,引用另一张表的主键,引用的表叫做子表,被引用的表叫做父表。
删除表的顺序:先删除子表,再删除父表。
创建表的顺序:先创建父表,再创建子表。
删除数据的顺序:先删除子表,再删除父表。
插入数据的顺序:先插入父表,再插入子表。
例句:foreign key (cno) references t_class(classno)
外键是cno,引用t_class表中的classno字段。
约束包含哪些?
非空约束:not null
唯一性约束:unique
主键约束:primary key
外键约束:foreign key
检查约束:check (Mysql不支持,oralce支持)
存储引擎:
1 . 什么是存储引擎:
Mysql中特有的一个术语,其他数据库没有(Oracle中有,但不叫存储引擎)
实际上存储引擎是一个表存储/组织数据的方式。
不同的存储引擎,表存储数据的方式不同。
2 . 怎么给表指定存储引擎?
在建表的时候,可以在最后括号的后面使用Engine指定存储引擎,CHARSET指定编码
默认为:Engine=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=utf8
结论:
Mysql5.1以前默认存储引是Myiasm,Mysql5.1以后默认为InooDB
3 . 怎么查看mysql支持那些存储引擎呢?
命令:show engines \G
Mysql5.7版本默认InnoDB
Mysql支持九大存储引擎,当前5.7版本支持8个,版本不同支持情况不同。
Mysql常用存储引擎:
MyISAM存储引擎?
它管理的表有一下特征?
使用三个文件表示每个表:
格式文件 ----存储表结构的定义 (mytable.frm)
数据文件 ----存储表行上的内容(mytable.MYD)
索引文件 ----存储表上的索引(mytable.MYI)
优点:压缩、只读表来节省空间。
缺点:事务处理不如InnoDB
索引是一本书的目录索引可以缩小扫描的范围,提高检索的效率。
Tips:对于一张表来说,只要是主键,或者加油unique约束的字段上会自动创建索引。
InnoDB存储引擎?
InnoDB存储引擎是Mysql默认的存储引擎,同时也是一个重量级的存储引擎。
InnoDB支持事务,支持数据库崩溃后自动恢复机制。
InnoDB最主要的特点是非常的安全!
它管理的表有下列特征?
每个InnoDB表在数据库目录中以 .frm 格式文件表示
InnoDB表空间 tablespace 被用于存储表的内容
提供一组用来记录事务性活动的日志文件
提供全ACID兼容: 原子性、一致性、隔离性、持久性
在Mysql服务器崩溃后提供自动恢复
多版本(MVCC)和行级锁定
支持外键及引用的完整性,包括级联删除和更新
优点:InnoDB最大的特点就是支持事务:保证数据的安全!!
缺点:效率不是很高,不能压缩,不能转换为只读,不能很好节省空间。
MEMORY存储引擎?
使用memory存储引擎的表,数据存储在内存中,且行的长度固定,
这两个特点使得memory存储引擎非常的快
memory存储引擎管理表有下列特征:
在数据库目录内,每个表均以 .frm 格式文件表示。
表数据及索引存储在内存中。
表级锁机制。
不能包含Text和Blob字段
Blob字段:图片,视频
Memory 存储以前被称为Heap引擎。
优点:查询效率是最高的
缺点:不安全,关机数据消失,因为数据和索引都是存在内存中。
内存和硬盘的区别:
内存:内存是直接取数据,电流的速度
硬盘:从硬盘上取,硬盘是机械行为,用磁针一针一针取
事务:(重点)
1 . 什么是事务??
一个事务其实就是一个完整的业务逻辑。
假设:转账从A账户向B账户转账10000.
将A账户的钱减去10000
将B账户的钱加上10000
这就是一个完整的业务逻辑
以上操作是一个最小的工作单元,要么同时成功,要么同时失败,不可在分,
这两个update语句要求必须同时成功或者同时失败,这样才能保证钱是正确的。
2 . 只有DML语才有用事务,其他语句和事务无关!!!
insert
delete
update
只有以上三个语句与事务有关系,其他都没有关系!!
因为只有以上是哪个语句是数据库表中进行数据增删改的。
只要你的操作设计数据的增删改,那么一定要考虑安全问题。
数据安全第一位。
3 . 假设所有的业务,只要一条DML语句就能完成,还有必要存在事务机制吗?
正是因为做某件事的时候需要多条DML语句共同联合起来才能完成。
所以需要事务的存在。如果任何一件复杂的事都能一条DML语句搞定,
那么事务则没有存在的意义了。
说到底什么是事务呢?
说到底,本质上,一个事务就是多条DML语句同时成功或者同时失败。
事务是怎么做到多条DML语句同时成功和失败的呢?
InnoDB提供了一组用来记录事务性活动的日志文件
事务开启:
DML·····DML·····DML
事务结束!
在事务的执行过程中,每一条DML操作都会记录到事务的日志文件中。
在事务的执行过程中,我们可以提交事务,也可以回滚事务。
提交事务?
清空事务性活动的日志文件,将数据全部彻底持久化到数据库表中。
提交事务标志着事务的结束,并且必须是成功的事务结束。
回滚事务?
将之前所有的事DML操作全部撤销,并且将清空事务性活动的日志文件
回滚事务,标志着事务的结束,并且是一种全部失败的结束。
怎么提交事务?回滚事务?
提交:commit;
回滚:rollback;(回滚永远只能回滚到上一次提交点)
事务:Transaction
Mysql当中默认的事务行为是自动提交的。AutoCommit;
每执行一次DML语句提交一次!
这种自动提交实际上是不符合我们的开发习惯的,因为一个业务通常是需要多条DML语句共同执行完成的,为了保证数据安全,必须要求同时成功之后在提交,所以不能执行一条就提交一条。
怎么将mysql的自动提交机制关闭掉呢?
先执行这个命令:start transaction 开启事务之后,autocommit关闭;
事务特性:
Mysql事务有四个特性:原子性,一致性,隔离性,持久性、四个特性统称为 :ACID
Atomicity: 原子性
说明事务是最小的工作单元不可再分。
Consistency : 一致性
所有事务要求在同一个事务当中,所有操作必须同时成功或者失败,保证数据一致性
Isolation: 隔离性
A事务和B事务之间有一定的隔离。不能互相干扰。
Durability: 持久性
事务最终结束的一个保障吗,事务提交,就相当于没有保存到硬盘上的数据,保存到硬盘上!
事务隔离性:
事务隔离级别:
A教室和B教室中间有一道墙,这道墙可以很厚,也可以很薄,这就是事务的隔离级别,
这道墙越厚,表示隔离级别就越高。
事务和事务之间的隔离级别有哪些呢? 四个级别
读未提交:read uncommitted (最低隔离级别)《提交之前就能读到》
什么是读未提交?:事务A可以读取到事务B未提交的数据
这种隔离级别存在的问题就是脏读现象:(Dirty Read)脏数据
这种隔离级别一般都是理论上的,大多数据都是从第二级别开始!
读已提交:read committed 《提交之后读到》
什么读已提交?:事务A只能读取到事务B提交后的数据
这种隔离级别解决了什么问题?
解决了脏读现象。
这种隔离级别存在的问题?
不可重复读取数据。
这种隔离级别是比较真实的数据,每一次读到的数据是绝对真实的数据。
Oracle数据库默认隔离级别是:读已提交:read committed
可重复读:repeatable read 《提交之后读不到》
什么是可重复读取?
事务A开启之后,不管是多久,每一次在事务A中读取到的数据都是一致的,即使事务B将数据已经修改,并且提交了,事务A读取到的数据还是没有发生改变,这就是可重复读。
解决了什么问题?
解决了 read committed 中不可重复读的问题。
可重复读存在的问题?
可能会出现幻影读。
每一次读取到的数据都是幻象的,不够真实。
举例:
早晨9点开始事务,只要事务不结束,到晚上九点,读到的数据是一样的!
序列化/串行化:serializable (最高隔离级别 )
这种隔离级别,效率最低,解决了所有的问题。
这种隔离级别表示事务排队,不能并发。
有点类似于Synchronized线程同步
每一次读取到的数据都是真实的,同步的。
Mysql5.7版本查看隔离级别:select @@tx_isolation
Mysql8之后改为select @@transaciton_isolation
Mysql默认隔离级别:repeatable read 可重复度
索引:
1 . 什么是索引?
索引是在数据库表的字段上添加的,是为了提高查询效率存在的一种机制。
一张表的一个字段可以添加一个索引,当然,多个字段联合起来也可以添加索引。
索引相当于一本书的目录,是为了缩小扫描范围而存在的一种机制。
对于一本字典来说,查找某个汉字有两种方式:
第一种方式:一页一页挨着找,直到找到为止,这种方式属于全字典扫描,效率低。
第二种方式:先通过目录(索引)定位一个大概的位置,然后直接定位到这个位置,做局域性扫描,缩小扫描范围,快速查找,这种查找方式属于通过索引检索,效率比较高。
比如说我们有一张表t_user,字段是id、name、age,我们要去用一个查询语句去查询:
select * from t_user where name = 'jack'
以上的这条SQL语句会去name字段上扫描,为什么?
因为查询条件是:name='jack'
如果name字段上没有添加索引(目录),或者没有给name字段创建索引,Mysql就会进行全表扫描,会将name字段上的每一个值都比对一遍,效率比较低。
Mysql在查询方面主要就两种方式:
第一种:全表扫描
第二种:根据索引检索。
注意:
在实际中,汉语字典前面的目录是排序的,按照a、b、c、d、e、f.....排序,
为什么排序呢?因为只有排序了才会有区间查找这一说!(缩小扫描范围其实
就是扫描某个区间罢了!)
在Mysql数据库中索引也是需要排序的,并且这个索引排序和TreeSet数据结构
相同。TreeSet底层是一个自平衡的二叉树!
在Mysql当中,索引是一个B-Tree数据结构,遵循左小右大原则存放,采用中序遍历方式遍历取数据。
索引实现原理:
t_user
id(PK) name 每一行记录在硬盘上都有物理存储编号
100 zhangsan 0X11111
120 lisi 0X22222
99 wangwu 0X33333
88 zhaoliu 0X44444
55 jack 0X55555
89 tom 0x66666
Tips:在任何数据库当中,主键上都会自动添加索引对象,id字段上自动有索引,因为id是PK。
在Mysql当中,一个字段上如果有unique约束的话,也会自动创建索引对象。
在任何数据库当中,任何一张表的任何一条记录在硬盘存储上都有一个物理存储的编号。
在Mysql当中,索引是一个单独的对象,不同的存储引擎以不同形式存在,在MyISAM存储引擎中,索引存储在一个.MYI的文件中,在InnoDB引擎中,索引存储在一个逻辑名称叫做tablespace的空间中,在MEMORY引擎中索引被存储在内存中,不管索引存储在哪里,索引在Mysql当中都是一个树的形式存在(自平衡二叉树:B-Tree)
根据上面的表,我们可以用平衡二叉树做一张简单的图:
比如说我们查询语句:
select * from t_user where id = 89;
Mysql发现id字段上有索引对象(idIndex),所以会通过索引对象idIndex进行查找,通过idIndex索引对象定位,根据二叉树左小右大的原则快速查找到89,通过89得到硬盘上的物理编号为0x66666,此时SQL语句转换成select * from t_user where 物理编号= 0x66666; 就可以直接去硬盘中取数据。
索引的实现原理:缩小扫描的范围,避免全表扫描。
在Mysql当中,主键上,以及unique字段上都会自动添加索引的!!!
在什么添加下,我们会考虑给字段添加索引呢??
条件1:数据量庞大(到底多大算庞大,这个根据每一个硬件环境不同,条件不一样)
条件2:该字段经常出现在where后面,以条件的形式存在,也就是说这个字段总是被扫描。
条件3:该字段很少DML(增删改)操作。因为DML之后索引结构需要重新排序。
建议不要随意添加索引,因为索引是需要维护的,太多的话反而会降低系统性能。
建议通过主键查询,或者unique约束的字段进行查询,效率是比较高的。
索引怎么创建?怎么删除?语法是什么?
创建索引:
create index emp_ename _index on emp(ename);
给emp表的ename字段添加索引名字为emp_ename _indexl;
删除索引:
dro index emp_ename _index on emp;
将emp表上的emp_ename _index索引对象删除;
怎么查看一个sql语句是否使用了索引进行检索?:explain关键字
explain select * from carwhere age= 15;
type=ALL && rows查询了6条字段,可以得出,age没有索引。
我们现在给age和cname添加索引:
CREATE INDEX car_age_index on car(age)
CREATE INDEX car_cname_index on car(cname)
再去查询的时候:
type变成了ref类型,rows查找数量也变少了。
数组+树的结合体,让我们在给字段添加了索引之后,甚至可以查询一条次就拿到数据。算法结构非常复杂。
索引失效:
什么时候索引失效?
失效的第一种情况:like模糊匹配 “%”
select * from emp where ename like '%T';
ename即使添加索引,也不会走索引,为什么?
原因是因为模糊匹配中用 ”%“ 开头了!!
尽量避免模糊查询的时候以 “%" 开始
这是一种优化的手段/策略。
失效的第二种情况:
使用or的时候会失效,如果使用or那么要求or两边的条件字段都要有索引,才会走索引, 如果其中一边有一个字段没有索引,那么另一个字段上的索引也会失效,所以这就是为什 么不建议使用or的原因。如果非要用or,不是索引的那个字段应该要unique约束。
失效的第三种情况:
使用复合索引的时候,没有使用左侧的列查找,索引失效
什么是复合索引?
两个字段或者更多的字段联合起来添加一个索引叫做复合索引。
失效的第四种情况:
在where中索引列参加了运算,索引失效。
失效的第五种情况:
在where当中索引列使用了函数
索引的分类:
单一索引:一个字段上添加索引
复合索引:多个字段上添加索引
主键索引:主键上天啊及索引
唯一索引:唯一性比较弱的字段上添加索引用处不大,越唯一效率越高。
MySQL数据库设计三大范式:
第一范式
要求任何一张表必须有主键,每一个字段原子性不可分割。
第二范式
在第一范式基础上,要求所有非主键字段,完全依赖主键,不产生部分依赖
第三范式
在第二范式基础上,要求所有非主键字段直接依赖主键,不要产生传递依赖
在设计数据库表的时候,按照以上范式进行,可避免数据冗余,空间的浪费
三范式是面试官经常问的,所以一定要熟记在心!!!
多对对怎么设计?
多对多,三张表,关系表两个外键!!!