一次不常见网络故障的启示

数码时尚

  故障现象:服务器是IBM X232 21Y,PⅢ 1.13GHz、512MB ECC SDRAM、IBM 18.2GB SCSI×3 Raid 5硬盘、Intel 10/100Mbps网卡。工作站是联想启天1000,D-link 530TX网卡。交换机为D-link 1024R。网线及模块是IBDN。某客户端无法登录,提示:“提供的域密码不正确,或被登录服务器拒绝”,按取消进入系统,ping本机通过,ping服务器也通过,检查域名正确,于是更换登录用户名,出现相同提示;尝试去掉登录域名,则可正常进入系统,打开网上邻居,可以看到4个工作站,但还是无法连上服务器(在地址栏输入服务器IP地址也无法连接)。

  解决过程:用测线仪检查网络连接,发现7号线指示灯不亮,但7号线的通断并不影响网络连接啊,再说ping服务器是通的。试用其他工作站连接到该工作站,居然一切正常!可以正常读取、复制共享的文件和文件夹!由于系统曾用GHOST备份过,于是没有多想就用GHOST恢复系统了,没想到恢复之后问题依旧,于是怀疑是网卡的故障,找来一台备用机,发现问题还是未解决。再回头查网络,这时想起该工作站连接的模块曾经出现过问题,难道是7号线的问题?于是重做了一个模块,居然发现还是7号线有故障!难道是交换机端的故障?用测线仪测试交换机端的水晶头,发现6、7号线均有故障,原来如此!更换交换机端的水晶头,测试8根线都正常了,满以为这下问题解决了,谁知这时问题更大了,ping服务器都不通了。再查网络,始终查不出问题,这时另一工作站也报告连不上服务器了,交换机有问题?重启交换机,问题依旧。偶然发现服务器网络连接图标一端长亮,一端长暗,难道频繁的网络错误请求导致了服务器网络连接出错?双击服务器网络连接图标无反应,点击其他图标正常;断定是服务器网络连接出错,重启服务器,所有工作站连接恢复正常。

  注意:不要过分相信测线仪的报告,应该只将它作为一种辅助诊断网络故障的手段。其次要通观全局,本次故障处理中由于发现工作站端的故障而忽略了服务器端的变化,使解决故障的时间拖延不少。