一、简介

对于MySQL等关系型数据库中的索引,可以从不同的维度对其分类,得到不同的名称,下面是常见的四种分类,在这里我们重点介绍按照字段约束分类:

按照算法分类

B Tree索引、Hash索引、R Tree索引、Full text索引

按照字段约束分类

主键索引、唯一索引、普通索引、全文索引、组合索引

按照索引字段是否排序分类

聚簇索引、非聚簇索引

聚簇索引按照索引量分类

稠密索引、稀疏索引

 

二、语句

CREATE TABLE table_name[col_name data type][unique|fulltext][index|key][index_name](col_name[length])[asc|desc]

1. unique|fulltext 为可选参数,分别表示唯一索引、全文索引

2. index和key为同义词,两者作用相同,用来指定创建索引

3. col_name为需要创建索引的字段列,该列必须从数据表中定义的多个列中选择

4. index_name为指定索引的名称,为可选参数,如果不指定,默认col_name为索引值

5. length为可选参数,表示索引的长度,只有字符串类型的字段才能指定索引长度

6. asc或desc指定升序或降序的索引值存储

 

三、索引类型

1. 普通索引

是最基本的索引,没有任何限制,有以下几种创建方式:

(1)直接创建索引

CREATE INDEX index_name ON table(column(length))

(2)修改表结构的方式添加索引

ALTER TABLE table_name ADD INDEX index_name ON (column(length))

(3)创建表的同时创建索引

CREATE TABLE table_name(
id INT(11) NOT NULL AUTO_INCREMENT,
title CHAR(255) CHARACTER NOT NULL,
content TEXT CHARACTER NULL,
time INT(10) NULL DEFAULT NULL,
PRIMARY KEY(id),
INDEX index_name(title(length))
)

(4)删除索引

DROP INDEX index_name ON table

2. 唯一索引

与普通索引类似,不同的是:索引列的值必须唯一,但允许有空值。如果是组合索引,那列值的组合必须唯一。有以下几种创建方式:

(1)创建唯一索引

CREATE UNIQUE INDEX index_name ON table(column(length))

(2)修改表的结构

ALTER TABLE table_name ADD UNIQUE index_name ON (column(length))

(3)创建表的时候直接指定

CREATE TABLE table_name(
id INT(11) NOT NULL AUTO_INCREMENT,
title CHAR(255) CHARACTER NOT NULL,
content TEXT CHARACTER NULL,
time INT(10) NULL DEFAULT NULL,
UNIQUE index_name(title(length))
)

3. 主键索引

是一种特殊的索引,一个表只能有一个主键,不允许有空值。一般是在建表的时候同时创建主键索引:

CREATE TABLE table_name(
id INT(11) NOT NULL AUTO_INCREMENT,
title CHAR(255) NOT NULL,
PRIMARY KEY(id)
)

4. 组合索引

指在多个字段上创建的索引,只有在查询条件中使用了创建索引时的第一个字段,索引才回被使用。使用组合索引时遵循最左前缀集合

ALTER TABLE table_name ADD INDEX name_city_age(name,city,age)

5. 全文索引

主要用来查找文本中的关键字,而不是直接与索引中的值相比较。fulltext索引跟其他索引大不相同,它更像是一个搜索引擎,而不是简单的where语句的参数匹配。fulltext索引配合match against操作使用,而不是一般的where语句加like。它可以在create table,alter table,create index使用,不过目前只有char、varchar、text列上可以创建全文索引。值得一提的是,在数据量较大的时候,现将数据放入一个没有全局索引的表中,然后再用create index创建fulltext索引,要比先为一张表建立fulltext然后再将数据写入的速度快很多。

(1)创建表的时候添加全文索引

CREATE TABLE table_name(
id INT(11) NOT NULL AUTO_INCREMENT,
title CHAR(255) CHARACTER NOT NULL,
content TEXT CHARACTER NULL,
time INT(10) NULL DEFAULT NULL,
PRIMARY KEY(id),
FULLTEXT(content)
)

(2)修改表结构时添加全文索引

ALTER TABLE table_name ADD FULLTEXT index_name(content)

(3)直接创建索引

CREATE FULLTEXT INDEX index_name ON table(content)

 

四、缺点

1. 虽然索引大大提高了查询速度,但同时却会降低更新表的速度,如对表进行insert、update和delete。因为更新表时,不仅要保存数据,还要保存索引文件。

2. 建立索引会占用磁盘空间的索引文件。一般情况这个问题不太严重,但如果你在一个大表上创建了多种组合索引,索引文件会增长很快。索引只是提高效率的一个因素,如果有大数据量的表,就需要花时间研究建立最优秀的索引,或优化查询语句。

 

五、注意事项

使用索引时,有以下一些技巧和注意事项:

1. 索引不会包含有null值的列

只要列中包含有null值都将不会被包含在索引中,复合索引中只要有一列含有null值,那么这一列对于此复合索引就是无效的。所以我们在数据库设计时不要让字段的默认值为null。

2. 使用短索引

对串列进行索引,如果可能应该指定一个前缀长度。例如,如果有一个CHAR(255)的列,如果在前10个或20个字符内,多数值是唯一的,那么就不要对整个列进行索引。短索引不仅可以提高查询速度而且可以节省磁盘空间和I/O操作。

3. 索引列排序

查询只使用一个索引,因此如果where子句中已经使用了索引的话,那么order by中的列是不会使用索引的。因此数据库默认排序可以符合要求的情况下不要使用排序操作;尽量不要包含多个列的排序,如果需要最好给这些列创建复合索引。

4. like语句操作

一般情况下不推荐使用like操作,如果非使用不可,如何使用也是一个问题。like "%aaa%"不会使用索引而like "aaa%"可以使用索引。

5. 不要在列上进行运算

这将导致索引失效而进行全表扫描,例如

SELECT * FROM table_name WHERE YEAR(column_name)<2017;

6. 不适用not in和<>操作。