最近有一个困惑,生产服务器上有一表索引建得乱七八糟,经过整理后需要新建几个索引,再删除几个索引,建立索引时使用联机(ONLINE=ON)创建,查看下服务器负载(磁盘和CPU压力均比较低的情况)后就选择业务时间创建,但是到删除索引时却遇到问题:阻塞,删除索引需要架构修改锁(SCH_M),有阻塞很正常,虽然查询使用NOLOCK提示降低了对其他会话的影响,但还是会在页或表上生成一些意向共享锁(IS),这些意向共享锁与SCH_M无法兼容,因此阻塞无可避免,悲催的是在该表上多个会话重复执行查询且该查询执行时间超过100秒,根本无法找到一个完美的时间空挡来执行删除操作。想着白天业务高峰不成,我晚上来,为此好几晚半夜爬起来做尝试删除操作,最后还是跟业务确认后使用KILL干掉所有长时间阻塞会话才得以删除成功。

啰啰嗦嗦一堆,问题来了:在联机创建索引时,同样需要架构修改锁(SCH_M),为什么这就不阻塞呢?


首先准备测试数据



--=============================
--创建测试数据库
CREATE DATABASE DB2
GO
USE db2
GO
--创建测试表
CREATE TABLE TB1004
(
    ID INT IDENTITY(1,1) PRIMARY KEY,
    C1 BIGINT
)

GO
--导入数据,本次测试导入100w数据
INSERT INTO TB1004()
SELECT OBJECT_ID FROM SYS.all_columns
go 2000

--查询导入的数据量
SELECT  COUNT(1) FROM TB1004



接下来就是准备抓起锁,我们使用XEVENT来完成



--创建扩展回话XE_LockMonitor
--增加监控事件sqlserver.lock_acquired和sqlserver.lock_released
--并按锁类型和数据库名来过滤数据
CREATE EVENT SESSION [XE_LockMonitor] ON SERVER 
ADD EVENT sqlserver.lock_acquired(
    ACTION(sqlserver.database_id,sqlserver.database_name,sqlserver.sql_text)
    WHERE ([sqlserver].[equal_i_sql_unicode_string]([sqlserver].[database_name],N'DB2') AND [mode]=(2))),
ADD EVENT sqlserver.lock_released(
    ACTION(sqlserver.database_id,sqlserver.database_name,sqlserver.sql_text)
    WHERE ([sqlserver].[equal_i_sql_unicode_string]([sqlserver].[database_name],N'DB2') AND [mode]=(2))) 
ADD TARGET package0.event_file(SET filename=N'D:\DB\XE_LockMonitor.xel')
WITH (MAX_MEMORY=4096 KB,EVENT_RETENTION_MODE=ALLOW_SINGLE_EVENT_LOSS,MAX_DISPATCH_LATENCY=30 SECONDS,MAX_EVENT_SIZE=0 KB,MEMORY_PARTITION_MODE=NONE,TRACK_CAUSALITY=OFF,STARTUP_STATE=OFF)
GO


建立完后查看该扩展事件属性

删除索引释放空间 删除索引标识xm_数据库

删除索引释放空间 删除索引标识xm_数据库_02

有了扩展事件会话,然后我们激活启用它



--=============================================================
--启动回话
ALTER EVENT SESSION [XE_LockMonitor] ON SERVER
STATE=START;



启动扩展会话后,选择“监视实时数据”,然后在弹出的窗口中,先配置要显示的数据,在标题栏右键选择“选择列”,选择以下我们关心的列,并保存。

删除索引释放空间 删除索引标识xm_sql_03

 

准备好测试环境,是时候开测数据啦



--========================
--脱机创建索引
--耗时5秒
CREATE INDEX IDX_OBJECTID
ON TB1004(ID)
WITH(ONLINE=OFF,MAXDOP=1)
GO
--========================
--删除索引
DROP INDEX IDX_OBJECTID ON TB1004
--========================
--联机创建索引
--耗时53秒
CREATE INDEX IDX_OBJECTID
ON TB1004(ID)
WITH(ONLINE=ON,MAXDOP=1)
GO
--========================
--删除索引
DROP INDEX IDX_OBJECTID ON TB1004


扩展会话捕获到的数据:

删除索引释放空间 删除索引标识xm_数据库_04

使用SELECT OBJECT_NAME(1269579561)查看发现OBJECT对象为TB1004

由上面的数据我们不难发现这么几个结论:

1.无论联机还是脱机创建索引时,架构修改锁的对象为HOBT和METADATA

2.删除索引操作时,架构修改锁的对象为OBJECT:TB1004

3.联机索引创建耗时53秒,脱机索引创建耗时53秒(在没有外部数据操作情况下),脱机索引创建耗时远小于联机索引创建

--============================================================

是时候揭晓谜底啦

我们开启一个会话,执行下面SQL:



--使用NOLOCK访问表
SELECT * FROM TB1004 WITH(NOLOCK)



再另外开启一个会话,执行下面SQL:



--====================================================
--使用SP_LOCK来获取锁
--查找某个对象上的锁
DECLARE @T TABLE
(
 SPID BIGINT,
 DataBaseID INT,
 OBJECTID BIGINT,
 IndexID BIGINT,
 LockType VARCHAR(20),
 LockResource NVARCHAR(200),
 LockMode NVARCHAR(20),
 LockStats NVARCHAR(200)
)
INSERT INTO @T
EXEC SP_LOCK

SELECT SPID
,DataBaseID
,DB_NAME(DataBaseID) AS DataBaseName
,OBJECTID
,OBJECT_Name(OBJECTID,DataBaseID) ObjectName
,IndexID
,LockType
,LockResource
,LockMode
,LockStats
FROM @T
WHERE OBJECTID=OBJECT_ID('TB1004')



删除索引释放空间 删除索引标识xm_删除索引释放空间_05

我们发现,即使使用NOLOCK提示,仍需要SCH_S锁,这就是为什么DROP INDEX时被阻塞的原因,因为在同一个资源(object_ID:1269579561)上有互斥的SCH_M锁和SCH_S锁。

而对于联机索引创建,索引创建会话使用的SCH_M锁的对象与NOLOCK查询的使用的SCH_S锁的对象不是同一个,因此不会阻塞。

相信诸位看官到此应该深深地明白WHY了吧。