服务器数据恢复环境&故障:
某公司一台存储设备存放公司内部重要文件。存储设备上有一组由6块硬盘组成的raid5磁盘阵列。存储设备在正常运行过程中突然崩溃,管理员强制重启后无法找到存储设备,多次重启后还是找不到存储设备。

为什么服务器断电会导致mongodb数据损坏 服务器突然断电,数据库_服务器

 

服务器故障分析:
经过数据恢复工程师和硬件工程师团队的检测和分析,初步判断这台存储设备故障原因应该是raid模块损坏。raid模块损坏故障包括raid信息丢失和raid模块硬件损坏。基于以往大量的案例经验,北亚企安数据恢复工程师团队判断该存储设备故障极有可能就是设备多次异常断电导致的。经过与用户方管理员的沟通得知这台存储在出现故障之前确实遭遇过数次非正常的断电关机,但每次断电后重启一切正常,因此未引起管理员的注意。即使存储设备崩溃后也没有意识到这次故障与以前设备多次异常断电有关系。

为什么服务器断电会导致mongodb数据损坏 服务器突然断电,数据库_服务器数据恢复_02

 

服务器数据恢复过程:
1、由硬件工程师对故障存储中所有硬盘做物理故障检测,经过检测没有发现所有硬盘都可以正常读取,不存在物理故障。
2、将所有硬盘以只读方式做完整镜像备份,后续的数据分析和数据恢复操作都基于镜像文件进行,避免在数据恢复过程中对原始数据造成二次破坏。
3、基于镜像文件分析故障存储中的raid5磁盘阵列的raid结构,获取所有硬盘在阵列中的盘序、校验方式和数据块大小等raid相关信息。利用这些raid相关重新构建一组raid5阵列。
4、对重构的raid5阵列进行逻辑校验,逻辑校验成功后让用户方工程师亲自进行数据验证。
5、经过用户方工程师的反复验证,没有发现任何问题,确认恢复出来的数据完整可用,用户方对数据恢复结果十分满意,本次数据恢复任务完成。

服务器数据安全Tips:
1、服务器和存储设备所在的机房应该尽量保障电源供应的稳定,如果有设备确实需要关机,一定要使用正确的关机方法关机,而不是直接断电。
2、使用年限比较长的一些老设备要经常检查,尤其是对“受过伤害”但依旧在运行的设备格外留意,随时注意其工作状态,发现问题及时处理。例如本案例中的存储设备,多次异常断电后并没有马上出现故障而是运行了一段时间后才突然崩溃。
3、做好数据备份,有了备份文件,就算是设备崩溃了也可以在最大程度上减少损失,将正常业务的影响降低到最小。

为什么服务器断电会导致mongodb数据损坏 服务器突然断电,数据库_服务器_03