2013.2.2年前,数据中心的p590有一组双机中一台down机了,这种情况我是最不愿意面对的,由于人员操作问题对它直接power-off。2013.2.3.号早上,尝试的对它开机来查看报错代码,可它只能开启1个钟头后就down了,其中的错误代码从MDA/CEC/CEC DC/PU-BOOK/CPU都有,甚至是MDA的送风风扇。
总结了几点P590的维护经验,也不算经验吧,只是一种思路。
1.消除除了PU-BOOK的其他错误报警,该更换的就更换,直至只剩下PU-BOOK代码为止。
2.由于P590上面的双PU-BOOK是做交叉冗余设置的,可以对其去掉(我碰见的只有双PU-BOOK)用一个PU-BOOK来开机测试,到了这一步基本上就可以判断故障的位置了(航空头插座记得拔掉,380V)
注意:PU-BOOK和CPU是一组套件的,不到万不得已绝对不能拆上面的CPU,客户现场的一个PU-BOOK里面的CPU就被我拆坏过。(那个小东西20万,就那个CPU,上面的触点全是黄金,因为黄金的导热性能是最好的)IBM他们也不会轻易去拆,因为拆了很容易就碰歪了上面的触点,而已一个触点要是歪了机器再开机就又报错,它是一整套关联性的。