数据库查询优化 --- 索引 Index

  • 什么是索引
  • 索引的实现方法
  • 聚集索引 和 非聚簇索引
  • 聚集索引
  • 非聚集索引
  • 组合索引
  • 索引的使用
  • 适合使用索引的场景
  • 不适合使用索引的场景
  • SQL创建索引


什么是索引

  • 没有加索引的数据,它的数据无序的放置在磁盘存储器上,一行一行的排列的很整齐
  • 因为数据是无序的, 查找时需要一行一行查找, 非常慢
  • 如果可以使用数据结构对数据进行储存, 可以大大减少查找时间

索引的实现方法

  • 主流的实现方法是使用B+树, B+是一个平衡二叉树
  • 将一个属性标为index, 则B+每个节点是属性的值,叶子节点为实际数据,这样可以通过B+树进行快速查找
  • 一般DBMS会自动根据主键建立索引,也就是自动将无序的数据转换成根据主键建立的B+树
  • 使用索引可以增加查询速度,但是会增删的速度会下降, 因为有可能要重构B+树

聚集索引 和 非聚簇索引

聚集索引

  • 聚集索引在叶子节点中存放的就是整张表的实际数据,也将聚集索引的叶子节点称为数据页。这个特性决定了索引组织表中数据也是索引的一部分
  • 每张表只能拥有一个聚集索引(一般默认为主键)
  • 也就是聚集索引的索引和实际数据在磁盘上是存放在一起的, 叶子节点储存的就是实际数据
  • 聚集索引需要满足以下两个条件:
  • The data or file, that you are moving into secondary memory should be in sequential or sorted order.
  • There should be a key value, meaning it can not have repeated values.

非聚集索引

  • 非聚集索引的数据和索引存放在不同的地方, 非聚集索引的叶子节点储存的是指向实际数据的指针
  • 一个表可以有多个非聚集索引

组合索引

  • 当查询涉及多个字段时, 可以对字段分别建立索引: 查找每个索引里匹配项,针对同时匹配两个索引的名单扫面它们页码的交集
  • 但是这样比较慢, 可以使用组合索引,使用多个字段建立一个索引
  • 但是建立复合索引,在更新时肯定会付出比单索引更大的代价

索引的使用

适合使用索引的场景

1.设置主键为索引。

2.当某个字段频繁的作为查询参数,查询条件的字段也建议使用,比如号码,唯一,且查询频率高

3. 外键也适合加上索引

3.排序的字段,当我们对一些数据量较大的表进行一个查询且排序,
例如日志表,都会使用到创建时间作为排序字段,并且来说,这些表的数据量都不小,这个时候,我们建立索引会有明显的效率提升。

4.还有我们做统计数据的时候,通常会对该字段进行一种数据的汇总统计,
在分组查询的时候也是一样的意思,这个时候,也建议建立索引。

不适合使用索引的场景

1.表记录较少,你一共就10条数据,我还建立一个索引?可能索引的数据存储都比实际数据都多。

2.还有一种就是上面已经说到的,高频的增删改表。比如流水表,秒级的增加数据。这种表结构,我们通常不建议。

3.查询条件几乎用不到的字段

4.还有就是那种,你选择他作为查询条件,但是几乎没有条件过滤的感觉的字段。
例如,性别,你说你查询男和女有多大的过滤?

SQL创建索引

CREATE INDEX index_name ON table_name (column_name)
CREATE INDEX MAIN_CATEGORY_NAME_INDEX ON BUSINESS_MAIN_CATEGORIES(main_category);