重启NAS设备急不得
网络设备
最近公司的NAS(Network Attached Storage网络附加存储)产品出现了问题,解决起来颇费周折,在此将维护经验告诉给大家,帮助大家正确处理类似问题。
笔者所在公司使用的是清华诚志NAS,是在一个周末出现了问题,周末之前设备都运行正常,而周末在家时却发现无法连接NAS设备了。不管是使用NAS建立的FTP还是直接通过管理IP访问NAS管理界面,都连接不上,就好像该IP对应的设备不存在一样,无法Ping通。当时在家没法解决问题,只好等下周到单位排除故障了。
周一到中心机房查看NAS运行情况,各个指示灯均显示一切正常,但笔者就是无法连接NAS的管理界面。
注:一般NAS设备都使用五个硬盘做RAID5,而且有两个网卡接口对应LAN0和LAN1,在设备面板上有显示LAN0口状态、LAN1口状态和系统运行状态以及各硬盘运行状态的指示灯,可以依靠这些指示灯排查NAS故障。
寻找根源
第一步:笔者怀疑有人修改了NAS的设置,但管理员密码只有笔者一个人知道。这个观点马上被否定了。
第二步:将网线从LAN0口更换到LAN1口,因为笔者设置NAS默认IP地址时曾经考虑到出问题的情况,所以给LAN1口设置了另一个IP地址。现在这个备用网口终于派上用场了。更换网卡接口后依然无法用备用IP地址登录。
第三步:笔者找出NAS管理光盘中的辅助工具,通过这个辅助工具来查找NAS的管理IP。这在以往是百试不爽的,每次都可通过它找出NAS的默认管理IP地址,即使与本地计算机不在一个网段也可找到。但是这次却没有发现。
第四步:在NAS手册中特别说明了不要随意插拔NAS电源,这种硬关机容易损坏NAS中的硬盘,但是笔者已经没有其他办法了,只得硬关机。
第五步:重新开启NAS设备后各个指示灯依然显示正常。笔者怀疑是NAS设置恢复到出厂参数了,应该有一个默认管理IP地址。再次尝试连接NAS设备,依然无法访问。
这个问题一直没有解决,两天后笔者再次尝试连接NAS,却发现可以正常登录了,一切恢复正常,FTP也正常了,故障莫名其妙消失了。
真相大白
为什么会这样呢?笔者咨询了厂商的技术人员,原来根据NAS中数据的多少,启动设备后硬盘会再次建立RAID5,RAID5的重建工作要花费很长的时间,在这段时间内我们是无法访问NAS的,即使连接管理IP也会出现上述情况。一般情况下,450GB的数据需要一天半的时间才能完成重建RAID5的工作,而且此间不能断电,否则数据有可能全部丢失。
后来笔者又咨询了公司的总务人员,才得知周末停了一次电,由于中心机房的UPS负载过大,所以没有坚持多长时间。周一一大早总务人员重新开启了包括服务器以及NAS在内的所有设备,而笔者周一进行的所有测试工作都是在NAS重建RAID5时进行的,所以无法正常访问。而等NAS重新建立RAID5后一切就恢复正常了。
总结:通过对这一故障的分析,大家可以发现NAS设备不能随便重启,特别是硬关机。当NAS中保存的数据比较多的时候,一定要选择合适的UPS保证NAS的稳定运行。如果要切断NAS电源,一定要先登录管理界面,进行软关机操作,这样才能确保数据不丢失。重启NAS后也不能着急,因为需要很长一段时间建立RAID5,因此不要轻易怀疑NAS设备会出问题,应该等待一段时间后再做检测。像笔者这样在RAID5建立过程中硬关机是非常危险的,有可能会使NAS中的宝贵数据消失得无影无踪。还好,笔者的运气比较好,资料依然存在。在此提醒各位网管,NAS重启千万不要着急,更不能随便重启NAS设备。