数据库查询优化 --- 索引 Index
- 什么是索引
- 索引的实现方法
- 聚集索引 和 非聚簇索引
- 聚集索引
- 非聚集索引
- 组合索引
- 索引的使用
- 适合使用索引的场景
- 不适合使用索引的场景
- SQL创建索引
什么是索引
- 没有加索引的数据,它的数据无序的放置在磁盘存储器上,一行一行的排列的很整齐
- 因为数据是无序的, 查找时需要一行一行查找, 非常慢
- 如果可以使用数据结构对数据进行储存, 可以大大减少查找时间
索引的实现方法
- 主流的实现方法是使用B+树, B+是一个平衡二叉树
- 将一个属性标为index, 则B+每个节点是属性的值,叶子节点为实际数据,这样可以通过B+树进行快速查找
- 一般DBMS会自动根据主键建立索引,也就是自动将无序的数据转换成根据主键建立的B+树
- 使用索引可以增加查询速度,但是会增删的速度会下降, 因为有可能要重构B+树
聚集索引 和 非聚簇索引
聚集索引
- 聚集索引在叶子节点中存放的就是整张表的实际数据,也将聚集索引的叶子节点称为数据页。这个特性决定了索引组织表中数据也是索引的一部分
- 每张表只能拥有一个聚集索引(一般默认为主键)
- 也就是聚集索引的索引和实际数据在磁盘上是存放在一起的, 叶子节点储存的就是实际数据
- 聚集索引需要满足以下两个条件:
- The data or file, that you are moving into secondary memory should be in sequential or sorted order.
- There should be a key value, meaning it can not have repeated values.
非聚集索引
- 非聚集索引的数据和索引存放在不同的地方, 非聚集索引的叶子节点储存的是指向实际数据的指针
- 一个表可以有多个非聚集索引
组合索引
- 当查询涉及多个字段时, 可以对字段分别建立索引: 查找每个索引里匹配项,针对同时匹配两个索引的名单扫面它们页码的交集
- 但是这样比较慢, 可以使用组合索引,使用多个字段建立一个索引
- 但是建立复合索引,在更新时肯定会付出比单索引更大的代价
索引的使用
适合使用索引的场景
1.设置主键为索引。
2.当某个字段频繁的作为查询参数,查询条件的字段也建议使用,比如号码,唯一,且查询频率高
3. 外键也适合加上索引
3.排序的字段,当我们对一些数据量较大的表进行一个查询且排序,
例如日志表,都会使用到创建时间作为排序字段,并且来说,这些表的数据量都不小,这个时候,我们建立索引会有明显的效率提升。
4.还有我们做统计数据的时候,通常会对该字段进行一种数据的汇总统计,
在分组查询的时候也是一样的意思,这个时候,也建议建立索引。
不适合使用索引的场景
1.表记录较少,你一共就10条数据,我还建立一个索引?可能索引的数据存储都比实际数据都多。
2.还有一种就是上面已经说到的,高频的增删改表。比如流水表,秒级的增加数据。这种表结构,我们通常不建议。
3.查询条件几乎用不到的字段
4.还有就是那种,你选择他作为查询条件,但是几乎没有条件过滤的感觉的字段。
例如,性别,你说你查询男和女有多大的过滤?
SQL创建索引
CREATE INDEX index_name ON table_name (column_name)
CREATE INDEX MAIN_CATEGORY_NAME_INDEX ON BUSINESS_MAIN_CATEGORIES(main_category);