接到电话说分部无法上网,而且是整个分部。 从what'sup想telnet上去,竟然无法登陆。 没办法, 踏上我的长征路,打的到分部。 先console上核心 看日志, 嘿嘿,发现点问题, 在看CPU使用率,show process cpu, 竟然达到90%多,厉害 。看了广播风暴再次来袭, 核心65连接下面五台华为的39系列, 我用show interface f xxxx---xxxx 看端口的情况, 好家伙,广播包真多, 查看完每个端口后,得出结论,四个端口是出口广播包,一个端口进口广播包,看下面拓扑就明白了
因为一台下联华为s39发送大量广播包,核心在发送给所有sw导致全网广播风暴。
找到原因好办了, 在连接那台交换机的端口上 shutdown, 稍等片刻, 几个部门打电话过来说可以上网了,right。 询问这里的网管员,最近有什么变动没有,有排除说终端导致这个问题么? 网管员告诉我说之前一天UPS断电,然后重新更换UPS旧这样了。于是找到那台华为的交换机,console进去看看,感觉好像没有什么啊。认真在看下, 没有了ip route 。 奇怪了,这些是华为人员配置的,没理由那么马虎啊! 于是配置上去, 想找出广播风暴的原因, 查看很多东西没发现, 后来回想起拓扑,发现是不是环路导致, 认真看下配置 disply curr赫然发现没有启用stp, 没理由啊 ,之前都没事的啊? 想想是否是因为什么原因导致配置消失了! 断电 ,交换机是这么连接电的: sw--------ups-------220V市电 UPS挂了导致直接断电,断电后交换机的配置被清除,原因是因为配置人员配置好设备, 配置好stp, 却没有save, 导致重启后配置文件丢失, 环路产生广播风暴。
后面就简单了 stp enable 搞掂, 在核心上启用之前关闭的端口,等待10分钟,一切正常。
收拾收拾, 回家!