一、说明

在SQL Server 的作业中,有些时候我们希望步骤在执行失败后可以重复执行多几次,而我产生这个念头的是因为我在执行某个步骤(这个步骤对分区表进行修改分区方案、分区函数)的时候出现死锁了,如下面描述:

消息1205,级别13,状态55,第1 行

事务(进程ID 115)与另一个进程被死锁在锁资源上,并且已被选作死锁牺牲品。请重新运行该事务。

我想到解决这个问题的方法是重复执行多几次这个步骤(经测试执行几次可行),所以这里就讲讲如果让数据库作业完成这一动作。

 

二、测试实验

(一) 测试方案:

我们在作业中设置了简单的两个步骤,步骤1往表中插入一条数据,步骤2更新这条记录,让计数器+1,这就测试了成功时候,说明重复次数是没用的;对步骤2进行修改,让步骤2抛出一个异常,因为我们需要对表进行计数器+1,所以我们这里就抛出一个异常,扑捉到这个异常,进行计数器+1后,再把这个异常抛出去,抛第一个异常是模拟执行失败的,抛第二个异常就是让作业在失败情况下重复执行,因为使用TRY和CATCH后第一个异常就给捕获了。

 

(二) 创建表:



CREATE TABLE [dbo].[TestJobCounts](
    [Id] [int] IDENTITY(1,1) NOT NULL,
    [Counts] [int] NULL,
    [UpdateTime] [datetime] NULL,
 CONSTRAINT [PK_TestJobCounts] PRIMARY KEY CLUSTERED
(
    [Id] ASC
)WITH (IGNORE_DUP_KEY = OFF) ON [PRIMARY]
) ON [PRIMARY]



 

(三) 创建步骤1需要执行的存储过程:



-- =============================================
-- Author:        <Viajar>
-- Create date: <2011.09.14>
-- Description:    <插入数据>
-- =============================================
CREATE PROCEDURE [dbo].[sp_Insert] 
AS
BEGIN
    INSERT INTO [TestBackupDB].[dbo].[TestJobCounts]
               ([Counts]
               ,[UpdateTime])
         VALUES
               (0
               ,getdate())
END



 

(四) 创建步骤2需要执行的存储过程:



-- =============================================
-- Author:        <Viajar>
-- Create date: <2011.09.14>
-- Description:    <更新数据>
-- =============================================
CREATE PROCEDURE [dbo].[sp_UpdateCount] 
AS
BEGIN
    BEGIN TRANSACTION AltPS
        BEGIN TRY
            UPDATE [TestBackupDB].[dbo].[TestJobCounts]
               SET [Counts] = [Counts]+1
            RAISERROR (N'This is message %s %d.', -- Message text.
               13, -- Severity,
               55, -- State,
               N'number', -- First argument.
               5); -- Second argument.
        END TRY

        BEGIN CATCH
          IF @@TRANCOUNT > 0
            PRINT 'Being ROLLBACK'
            ROLLBACK TRANSACTION AltPS--回滚
            UPDATE [TestBackupDB].[dbo].[TestJobCounts]
               SET [Counts] = [Counts]+1
             WHERE Id = (select max(id) from [TestJobCounts])
            PRINT '失败'
            RAISERROR (N'This is message %s %d.', -- Message text.
               13, -- Severity,
               55, -- State,
               N'number', -- First argument.
               5); -- Second argument.
        END CATCH

        IF @@TRANCOUNT > 0
        BEGIN
            PRINT 'Being COMMIT'
            COMMIT TRANSACTION AltPS;--执行
            PRINT '成功'
        END
END



 

(五) 创建作业:



USE [msdb]
GO
/****** 对象:  Job [测试作业执行次数]    脚本日期: 09/14/2011 11:36:51 ******/
BEGIN TRANSACTION
DECLARE @ReturnCode INT
SELECT @ReturnCode = 0
/****** 对象:  JobCategory [[Uncategorized (Local)]]]    脚本日期: 09/14/2011 11:36:51 ******/
IF NOT EXISTS (SELECT name FROM msdb.dbo.syscategories WHERE name=N'[Uncategorized (Local)]' AND category_class=1)
BEGIN
EXEC @ReturnCode = msdb.dbo.sp_add_category @class=N'JOB', @type=N'LOCAL', @name=N'[Uncategorized (Local)]'
IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback

END

DECLARE @jobId BINARY(16)
EXEC @ReturnCode =  msdb.dbo.sp_add_job @job_name=N'测试作业执行次数', 
        @enabled=1, 
        @notify_level_eventlog=0, 
        @notify_level_email=0, 
        @notify_level_netsend=0, 
        @notify_level_page=0, 
        @delete_level=0, 
        @description=N'无描述。', 
        @category_name=N'[Uncategorized (Local)]', 
        @owner_login_name=N'sa', @job_id = @jobId OUTPUT
IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback
/****** 对象:  Step [插入一条数据]    脚本日期: 09/14/2011 11:36:52 ******/
EXEC @ReturnCode = msdb.dbo.sp_add_jobstep @job_id=@jobId, @step_name=N'插入一条数据', 
        @step_id=1, 
        @cmdexec_success_code=0, 
        @on_success_action=3, 
        @on_success_step_id=0, 
        @on_fail_action=2, 
        @on_fail_step_id=0, 
        @retry_attempts=0, 
        @retry_interval=0, 
        @os_run_priority=0, @subsystem=N'TSQL', 
        @command=N'exec dbo.sp_Insert', 
        @database_name=N'TestBackupDB', 
        @flags=0
IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback
/****** 对象:  Step [执行多次存储过程]    脚本日期: 09/14/2011 11:36:52 ******/
EXEC @ReturnCode = msdb.dbo.sp_add_jobstep @job_id=@jobId, @step_name=N'执行多次存储过程', 
        @step_id=2, 
        @cmdexec_success_code=0, 
        @on_success_action=1, 
        @on_success_step_id=0, 
        @on_fail_action=2, 
        @on_fail_step_id=0, 
        @retry_attempts=5, 
        @retry_interval=1, 
        @os_run_priority=0, @subsystem=N'TSQL', 
        @command=N'exec dbo.sp_UpdateCount', 
        @database_name=N'TestBackupDB', 
        @flags=0
IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback
EXEC @ReturnCode = msdb.dbo.sp_update_job @job_id = @jobId, @start_step_id = 1
IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback
EXEC @ReturnCode = msdb.dbo.sp_add_jobschedule @job_id=@jobId, @name=N'执行时间', 
        @enabled=1, 
        @freq_type=4, 
        @freq_interval=1, 
        @freq_subday_type=4, 
        @freq_subday_interval=10, 
        @freq_relative_interval=0, 
        @freq_recurrence_factor=0, 
        @active_start_date=20110914, 
        @active_end_date=99991231, 
        @active_start_time=0, 
        @active_end_time=235959
IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback
EXEC @ReturnCode = msdb.dbo.sp_add_jobserver @job_id = @jobId, @server_name = N'(local)'
IF (@@ERROR <> 0 OR @ReturnCode <> 0) GOTO QuitWithRollback
COMMIT TRANSACTION
GOTO EndSave
QuitWithRollback:
    IF (@@TRANCOUNT > 0) ROLLBACK TRANSACTION
EndSave:



附图一:设置步骤之间的关系:

SQL Server在哪用sql语句 sql server使用步骤_数据库

(图1)

附图二:设置步骤2失败时重试的次数以及每次重试的时间间隔,这里需要注意的是:1,如果步骤2执行成功,是不会执行重试的,直接就退出报告成功的作业了;2,这里重试次数设置为5,那么一共执行的次数就会是6次,因为要加上本身执行那一次;

SQL Server在哪用sql语句 sql server使用步骤_存储过程_02

(图2)

 

三、测试效果

(一) 执行中,注意状态中的重试间隔:

SQL Server在哪用sql语句 sql server使用步骤_SQL Server在哪用sql语句_03

(图3)

(二) 执行完,这是重复执行了5次依然失败的效果图:

SQL Server在哪用sql语句 sql server使用步骤_EXEC_04

(图4)

(三) 查看表,发现Counts的数值是6,说明本身执行1次,外加重试执行5次:

SQL Server在哪用sql语句 sql server使用步骤_存储过程_05

(图5)

 

四、参考文献