成为服务器监控高手

网络设备

身为企业网管你是否遇到过服务器突然损坏造成企业业务受损的麻烦?你是否在设备出现故障时后悔、抱怨为何没有早点发现问题?你是否因没有合理监控服务器而让小麻烦变成大麻烦?

如果你回答“是”,那么你是一个不懂得如何监控服务器的不合格网管,你需要我们的特训!

12-b11-2.jpg
一个小工具就可以实现对WWW.FTP的监控

成为监控高手的意义

可能很多读者都会对“监控网络设备”这一说法嗤之以鼻,认为出现问题能够解决就行了,平时用来进行监控的时间还不如拿来上网看看别人的维修经验。其实不然,有很多故障是无法排除的,而且维修所花时间带来的服务暂停、网络瘫痪等危害也是无法避免的。下面我们就来看看维修高手与监控高手的切身感受。

维修高手:平时只要网络能够运行就天天泡论坛学习别人的维修经验,当问题出现后尽量自己动手,实在不行再找服务器厂商或专家。然而,故障的出现总是那么突然,很多时候我都是在凌晨时分在家中被领导叫到单位去维修,而且故障的种类千奇百怪,排查、修复需要费九牛二虎之力。然而,我这样卖命,领导还总是责怪我为什么排除故障需要那么长的时间,给公司带来的业务损失也直接导致了我的奖金损失。

监控高手:每天到单位先花一个多小时的时间细心查看一下各个监控软件、监控设备的日志信息,通过这些了解企业所有服务器的运行情况。其他时间,自己上网学习新技术或者兼职挣些外快,在下班前一小时再次查看这些监控日志保证回家后网络设备仍可完好运行。如果在监控日志上发现了不对劲的地方可马上做出反应,关闭非法程序和出问题的服务,在问题严重的情况下还可以联系厂商在保证企业业务正常运转的前提下进行解决。这几年由于对设备做好了监控工作,企业没有因网络故障而遭受损失,自己的年终奖金和兼职收入越来越多。

从维修高手的“自白”中,我们可以知道虽然“亡羊补牢”为时不晚,但是损失已经产生,也带来了恶劣后果,所以说真正能够避免问题发生的“防患于未然”才是网管的最高境界。身为网管一定要学会监控服务器的方法,只有成为监控高手我们才能够保证企业网络高效率地工作。

相信各位读者看了“成为监控高手的意义”后都明白了维修高手和监控高手之间的差距,也都想让自己尽快成为监控高手,从而安安稳稳地做好网管工作。下面笔者就介绍如何有效地完成对服务器的监控工作。

各位高手、菜鸟都知道,服务器作为企业网络的主力设备之一,对它的监控是非常重要的。一般服务器监控高手会从软件、硬件、系统三个方面入手实施监控,以确保自己效率最高、工作量最小、工资最高。现在,就让我们开始特训。

学会驾驭监控软件

这里的“软件”主要是指那些安装在服务器系统上的各种网络、服务器监控软件,它们从类别上分主要有监视服务的软件、监视流量的软件、监视硬件的软件等。拥有并掌握了这些软件后,网管就可以达到随时随地监控服务器的目的,服务器状态都将记录在案,网管可以更及时、更准确地发现问题并解决问题,大幅度提高企业网络的运行效率。

监视服务的软件主要是针对某个服务的运行情况进行记录。例如,我们最常见的“IISlog”,它可以在IIS服务出现问题时迅速记录情况并通知网管,此外还有“ftp log”以及各种服务监视软件具备记录功能。基本上每个常用服务都会有与之对应的监视软件,在监视过程中,软件会按照管理者设置的参数要求进行报警。

监视流量的软件主要针对网络流量进行记录。这是因为服务器上的服务基本上都是依托网络提供给客户机的,网络流量异常很有可能造成服务体系崩溃,另外网络流量异常也在一定程度上说明企业网内部存在病毒或遭到了攻击。我们可以在平时多用这些软件监视网络和服务器,当网络中出现流量异常时就得提高警惕了。

监视硬件的软件是针对服务器中某个硬件进行监控的工具。例如针对硬盘RAID阵列和工作状态进行维护,针对硬盘剩余空间进行记录,针对服务器的UPS工作状态进行控制和管理等。一般情况下,这些软件都不能通用,我们要根据服务器使用的硬件产品型号去选择,和监视服务软件一样当出现问题时监视硬件的软件会自动报警。

让系统为你效力

除了从软件和硬件方面入手监控服务器外,从服务器系统自身出发,懂得“明察秋毫”也是非常重要的。不管是Linux系统还是Windows系统自身都拥有监控功能,这些监控功能可充当前面介绍的监控软件的助手,可以针对服务器运行状况的基本信息进行监控,不过它们是系统自带的功能,所以在兼容性和系统资源占用方面的表现非常不错,不会带来任何安全隐患和不稳定因素。

笔者在此主要以Windows系统为例进行介绍。我们可以通过任务管理器了解当前的内存资源以及CPU资源占用情况。如果发现CPU占用率过高则说明服务器中有可能存在病毒、网络中有蠕虫存在、网络服务设置不合理等情况出现了。如果发现内存资源占用率过高,则说明服务器自身负载太大,不能够满足企业应用。此外,系统服务与日志查看器也是监控高手了解服务器状态的窗口,在此类工具的帮助之下,网管既可以完成对服务器系统的优化工作也可以了解系统启动和运行中存在的故障。

善于使用“远程助手”

要想成为服务器监控高手仅仅掌握对监控软件、系统的应用是不够的,因为我们不可能会随时随地在公司服务器上操作,所以我们还需要一名“得力助手”,它就是“远程监控”。通过远程监控,我们可以在家中或其他办公地点通过网络来了解和掌握公司服务器的运行情况,结合视频监控系统可以做到对服务器甚至整个机房的环境都心中有数。

远程监控主要分为系统监控和设备监控两种:所谓系统监控就是通过VPN或远程桌面服务从网络的另一端连接到服务器,对服务器进行操作和管理,这样就可以随时了解服务器的系统、软件、服务运行状态;而设备监控关注得更多的是硬件,我们可以利用网络通过专业硬件检测工具对硬件进行维护,也可以利用监控摄像头或监控系统来监控设备。

学会解读设备的“暗语”

对硬件设备的监控在日常监控工作中是非常重要的,通过对设备指示灯的观察,往往可以提前发现问题。因此,可以说对硬件设备的监控就是对各种设备指示灯的监控。

学会解读设备的“暗语”,主要是指通过服务器的各个状态指示灯来了解其运行情况,包括通过电源灯了解电力供应情况,通过硬盘灯了解RAID的工作情况等。(服务器指示灯方面的知识可参看《电脑报》今年第9期的《指示灯能告诉我们什么》)。

真正的“持之以恒”

即使我们掌握了上面介绍的所有监控方法,如果没有获得真正的监控“法宝”也依然不能被称为监控高手。那么这个真正的“法宝”是什么呢?它就是“持之以恒”。

我们要将查看监控记录信息当成一个日常工作去做,要持之以恒,不能够隔三差五想看就看,不想看就弃之不理。只有真正的将每天查看监控日志当成一种习惯,才能够在第一时间发现问题并解决问题。

笔者也曾将自己的监控经验告诉给几位朋友,可惜他们都没有坚持下来,最后使花费了大量精力和人力建立的监控系统成为了摆设,所以笔者衷心希望各位立志成为监控高手的读者一定要保持一颗平常心,能够将查看监控信息的习惯长期坚持下来。

监控高手的装备

对于各位新人来说,不可能有丰富的经验和灵敏的“嗅觉”在第一时间发现问题,也不可能频繁地在服务器上选择和试用监控软件,毕竟服务器的稳定是非常关键的,所以在此笔者向大家推荐几个帮助监控的“装备”。

装备名称:PRTG

装备介绍:PRTG是网络流量监控工具,通过PRTG我们可以清楚地了解到服务器网卡数据流量信息,并可根据这些流量绘制出基于网页形式的查看页面以便长期观察。

装备名称:Wireshark

装备介绍:用于监控服务器网卡和网络数据流量的工具,通过它可以对网络使用状况、数据发送情况有一个清晰的了解,该工具是流量监控方面的佼佼者,得到了众多资深网管的喜爱。

装备名称:IIS Monitor

装备介绍:该工具是监控IIS服务的好帮手,通过它可以同时对同一台服务器上的多个网站运行状况进行监视,任何问题都将记录在日志中。对于服务器上安装了WWW服务的用户来说,这个工具非常实用。

装备名称:Remote Administrator

装备介绍:除了使用系统自带的“远程桌面”外,通过Remote Administrator来完成远程管理和监控工作也是明智之选。它具备所有远程管理功能而且占用服务器的资源非常少,可以轻松实现远程和本地的文件资源共享。

以上“装备”的下载地址均为:http://download.cpcw.com