一、简介
对于MySQL等关系型数据库中的索引,可以从不同的维度对其分类,得到不同的名称,下面是常见的四种分类,在这里我们重点介绍按照字段约束分类:
按照算法分类 | B Tree索引、Hash索引、R Tree索引、Full text索引 |
按照字段约束分类 | 主键索引、唯一索引、普通索引、全文索引、组合索引 |
按照索引字段是否排序分类 | 聚簇索引、非聚簇索引 |
聚簇索引按照索引量分类 | 稠密索引、稀疏索引 |
二、语句
CREATE TABLE table_name[col_name data type][unique|fulltext][index|key][index_name](col_name[length])[asc|desc]
1. unique|fulltext 为可选参数,分别表示唯一索引、全文索引
2. index和key为同义词,两者作用相同,用来指定创建索引
3. col_name为需要创建索引的字段列,该列必须从数据表中定义的多个列中选择
4. index_name为指定索引的名称,为可选参数,如果不指定,默认col_name为索引值
5. length为可选参数,表示索引的长度,只有字符串类型的字段才能指定索引长度
6. asc或desc指定升序或降序的索引值存储
三、索引类型
1. 普通索引
是最基本的索引,没有任何限制,有以下几种创建方式:
(1)直接创建索引
CREATE INDEX index_name ON table(column(length))
(2)修改表结构的方式添加索引
ALTER TABLE table_name ADD INDEX index_name ON (column(length))
(3)创建表的同时创建索引
CREATE TABLE table_name(
id INT(11) NOT NULL AUTO_INCREMENT,
title CHAR(255) CHARACTER NOT NULL,
content TEXT CHARACTER NULL,
time INT(10) NULL DEFAULT NULL,
PRIMARY KEY(id),
INDEX index_name(title(length))
)
(4)删除索引
DROP INDEX index_name ON table
2. 唯一索引
与普通索引类似,不同的是:索引列的值必须唯一,但允许有空值。如果是组合索引,那列值的组合必须唯一。有以下几种创建方式:
(1)创建唯一索引
CREATE UNIQUE INDEX index_name ON table(column(length))
(2)修改表的结构
ALTER TABLE table_name ADD UNIQUE index_name ON (column(length))
(3)创建表的时候直接指定
CREATE TABLE table_name(
id INT(11) NOT NULL AUTO_INCREMENT,
title CHAR(255) CHARACTER NOT NULL,
content TEXT CHARACTER NULL,
time INT(10) NULL DEFAULT NULL,
UNIQUE index_name(title(length))
)
3. 主键索引
是一种特殊的索引,一个表只能有一个主键,不允许有空值。一般是在建表的时候同时创建主键索引:
CREATE TABLE table_name(
id INT(11) NOT NULL AUTO_INCREMENT,
title CHAR(255) NOT NULL,
PRIMARY KEY(id)
)
4. 组合索引
指在多个字段上创建的索引,只有在查询条件中使用了创建索引时的第一个字段,索引才回被使用。使用组合索引时遵循最左前缀集合
ALTER TABLE table_name ADD INDEX name_city_age(name,city,age)
5. 全文索引
主要用来查找文本中的关键字,而不是直接与索引中的值相比较。fulltext索引跟其他索引大不相同,它更像是一个搜索引擎,而不是简单的where语句的参数匹配。fulltext索引配合match against操作使用,而不是一般的where语句加like。它可以在create table,alter table,create index使用,不过目前只有char、varchar、text列上可以创建全文索引。值得一提的是,在数据量较大的时候,现将数据放入一个没有全局索引的表中,然后再用create index创建fulltext索引,要比先为一张表建立fulltext然后再将数据写入的速度快很多。
(1)创建表的时候添加全文索引
CREATE TABLE table_name(
id INT(11) NOT NULL AUTO_INCREMENT,
title CHAR(255) CHARACTER NOT NULL,
content TEXT CHARACTER NULL,
time INT(10) NULL DEFAULT NULL,
PRIMARY KEY(id),
FULLTEXT(content)
)
(2)修改表结构时添加全文索引
ALTER TABLE table_name ADD FULLTEXT index_name(content)
(3)直接创建索引
CREATE FULLTEXT INDEX index_name ON table(content)
四、缺点
1. 虽然索引大大提高了查询速度,但同时却会降低更新表的速度,如对表进行insert、update和delete。因为更新表时,不仅要保存数据,还要保存索引文件。
2. 建立索引会占用磁盘空间的索引文件。一般情况这个问题不太严重,但如果你在一个大表上创建了多种组合索引,索引文件会增长很快。索引只是提高效率的一个因素,如果有大数据量的表,就需要花时间研究建立最优秀的索引,或优化查询语句。
五、注意事项
使用索引时,有以下一些技巧和注意事项:
1. 索引不会包含有null值的列
只要列中包含有null值都将不会被包含在索引中,复合索引中只要有一列含有null值,那么这一列对于此复合索引就是无效的。所以我们在数据库设计时不要让字段的默认值为null。
2. 使用短索引
对串列进行索引,如果可能应该指定一个前缀长度。例如,如果有一个CHAR(255)的列,如果在前10个或20个字符内,多数值是唯一的,那么就不要对整个列进行索引。短索引不仅可以提高查询速度而且可以节省磁盘空间和I/O操作。
3. 索引列排序
查询只使用一个索引,因此如果where子句中已经使用了索引的话,那么order by中的列是不会使用索引的。因此数据库默认排序可以符合要求的情况下不要使用排序操作;尽量不要包含多个列的排序,如果需要最好给这些列创建复合索引。
4. like语句操作
一般情况下不推荐使用like操作,如果非使用不可,如何使用也是一个问题。like "%aaa%"不会使用索引而like "aaa%"可以使用索引。
5. 不要在列上进行运算
这将导致索引失效而进行全表扫描,例如
SELECT * FROM table_name WHERE YEAR(column_name)<2017;
6. 不适用not in和<>操作。