问题描述

我的DB2多分区数据库(DPF)环境,操作系统时间被意外/人工修改了,现在我修改回来之后,发现所有的更新操作都会失败(insert/delete/update/import/create/load)报错如下:


SQL0903N  COMMIT statement failed, transaction rolled back.  Reason code: "2".


SQLSTATE=40504


原因

在非分区的数据库环境中,修改系统时间对DB2的影响很小,一般不用担心,具体可以参考链接

Scenario: Changing the system clock



但在DPF环境下,有需要注意的地方。每个节点的DB2的

日志控制文件都会记录一个虚拟时间戳VTS(Virtual Timestamps), 该时间戳只允许往前走,不允许往后走(working as design),也就是说当系统时间跳至将来某个时间T1,VTS会跟着调至T1,这时候数据库不会出现问题,但是当系统时间改回原来的正确时间,VTS不会跟着改回来。如果VTS和当前系统时间的差超过了

MAX_TIME_DIFF,那就就会出现SQL0903N, Reason Code “2”的报错,这是DB2的设计。





问题重现

DPF环境默认情况下,结论如下:



1. 时间往后修改一天,操作正常


2. 时间往后修改一天,再修改回来,操作报错 SQL0903N RC=2


3. 时间往前修改一天,操作报错 SQL0903N RC=2


4. 时间往前修改一天,再修改回来,操作正常


(“往后”在这里指修改到将来的某个时间点,“往前”指修改到过去的某个时间点)

C:\windows\system32>db2 "insert into t1 values(100)"
DB20000I  The SQL command completed successfully.

C:\windows\system32>date
当前日期: 2017/05/27 周六
输入新日期: (年月日) 2017/05/28

C:\windows\system32>db2 "insert into t1 values(528)" <-时间往后修改一天,操作正常
DB20000I  The SQL command completed successfully.

C:\windows\system32>date
当前日期: 2017/05/28 周日
输入新日期: (年月日) 2017/05/27

C:\windows\system32>db2 "insert into t1 values(527)" <-时间往后修改一天,再修改回来,操作报错 SQL0903N RC=2
DB21034E  The command was processed as an SQL statement because it was not a
valid Command Line Processor command.  During SQL processing it returned:
SQL0903N  COMMIT statement failed, transaction rolled back.  Reason code: "2".
SQLSTATE=40504

=================换另外一个数据库=============

C:\windows\system32>db2 "insert into t1 values(100)"
DB20000I  The SQL command completed successfully.

C:\windows\system32>date
当前日期: 2017/05/27 周六
输入新日期: (年月日) 2017/05/26

C:\windows\system32>db2 "insert into t1 values(100)" <-时间往前修改一天,操作报错 SQL0903N RC=2
DB21034E  The command was processed as an SQL statement because it was not a
valid Command Line Processor command.  During SQL processing it returned:
SQL0903N  COMMIT statement failed, transaction rolled back.  Reason code: "2".
SQLSTATE=40504

C:\windows\system32>date
当前日期: 2017/05/26 周五
输入新日期: (年月日) 2017/05/27

C:\windows\system32>db2 "insert into t1 values(100)" <-时间往前修改一天,再修改回来,操作正常
DB20000I  The SQL command completed successfully.



注意:上面的问题在单分区的环境下是不会出现的,在多分区环境下会出现,即使这个多分区环境只有一个物理节点。



解决办法

1. 如果VTS和当前系统时间差小于24小时,可以修改实例配置参数MAX_TIME_DIFF并重启实例(可以等到VTS和系统时间一致时,再修改回来),修改之后的值超过时间差即可,最大值是24小时。



2.如果时间差超过24小时,可以考虑以下方案:


--重建数据库


--什么也不做,等实际时间追上VTS,但这段时间内不能做更新操作


--把日志控制文件发给IBM售后技术支持,让他们帮忙修改一下VTS,不过做完之后需要对数据库做一个全库离线备份。