自己动手做评测──专业评测软件

Author: 蔡宇镝 Date: 2001年 14期

    在各种电脑报刊杂志上,大家都看到过有关电脑硬件的测试报告。通常,这些测试报告或多或少会提供一些测试数据。不过,这些数据究竟代表什么意思,相信许多朋友看过之后并不是非常明白。其实,这些都是用于硬件评测的软件测试出来的数值。评测软件的原理,就是将一些标准的软件采集为范例,然后将这些范例在测试机器上运行,然后与原始的数值比较或计算执行所需的时间以作为性能表现的依据。下面,向大家列举几套最著名的的电脑硬件测试软件,以起到抛砖引玉的作用。
      一、WinBench 99
      WinBench分为好几类。我们这次介绍的WinBench 99是一种用于Windows系统中测试子系统运行情况的测试标准程序。测试的对象包括:图形、磁盘、处理器(包括浮点运算单元)及视频(包括DirectDraw)等子系统。WinBench 99的所有测试都是32位的,这些测试只能在Windows 95/98和Windows NT平台上运行。它的图形回放技术能够重复用在商业WinStone 99或高端WinStone 99测试程序所进行的图形操作方面。WinBench 99可以对下列的各种WinMark指标进行测试,从而可以对PC的图形、磁盘和处理器子系统性能给出全面的评估。这些指标包括:
      WinMark 99商业图形与磁盘标准
      WinMark 99高端图形与磁盘标准
      CPUMark 32标准
      FPU WinMark 99标准
      除了这些关键测试指标以外,WinBench 99还能利用全动视频测试来评估PC的视频子系统的性能,用DirectDraw测试来评估Windows的硬件图形性能,通过磁盘测试检测磁盘的访问时间和传输速率。
      下面介绍一下WinBench 99的基本使用方法:
      1.运行测试
      如^14060102a^1所示,WinBench 99的大部分测试都很容易运行,你只须先选择好所需要的测试项目,然后单击运行(Run)按钮即可。但对于有些测试项目,需要在Test Settings(测试设置)对话框中编辑缺省的设置选项。
      2.WinBench 99的测试设置
      通过修改“Test Settings”对话框(^14060102b^2)中的设置对WinBench 99的磁盘、视频和DirectDraw的测试功能进行增减。例如,可以指定同时显示的视频播放窗口数,还可以让程序计算所有测试过程中CPU的利用率。另外,程序可以自动保存对标准设置进行的修改,在下次运行时,你不必再从头开始编辑设置选项。但对于一些特殊的测试功能,你还是需要在每次运行WinBench 99时重新进行设置。
      在WinBench 99中有一项特殊功能,利用它可以在Create Batch File(创建批处理文件)对话框中定制出一些测试项目,然后在测试设置对话框中,选择这些批处理文件作为当前测试要求,这样就可利用预先定义的设置和运行步骤进行多次测试。
      要改变测试设置参数,可以使用如下方法:
      (1)从WinBench 99 Edit(编辑)菜单中选择“Test Settings”菜单项,然后在弹出的测试设置对话框中选择与所要修改的设置功能相对应的标签。你可以修改多个标签窗口中的信息。
      (2)在每个标签窗口中,输入要求测试程序使用的参数值。
      (3)选好设置以后,单击“ok”按钮保存设置,或者单击“Cancel”按钮取消所做的修改。在“Common”(公共)标签中可以指定一些通用的参数。另外,WinBench 99会将出错信息写入Error.txt文件中。
      另外,在测试的时候有一点必须要注意的是要执行完硬盘碎片整理后并确定没有其他程序在后台运行再进行测试,以减少误差。此外,在进行图形测试前,应将Windows任务栏设置成自动隐藏方式,并取消它的“总在最前”的设置。
      3. 分析WinBench 99测试结果
      程序的测试结果使用了多种计量单位(例如每秒字节数等),也有一些测试结果是无单位的。如^14060102c^3所表示的就是测试出来的各项数值,一般说,测试结果是越大越好。
      (1)CPU利用率测试结果
      在各种WinBench 99测试返回的CPU利用率指标中,都是越小的值表示该子系统的性能越好。这一指标表示的是对该子系统的测试所占用的CPU时间与CPU运行总时间的比值。CPU在测试中消耗的时间越少,它为其他应用程序服务的时间就越多,说明子系统的性能越好。
      (2)图形WinMark 99标准
      商业与高端图形WinMark测试的输出结果为进行过标准化的分数。分数越大意味着图形性能越好。
      (3)图形遍历测试
      GDI/USER遍历测试程序集返回每种遍历测试指标。WinBench 99用百万像素/每秒为单位给出结果。
      (4)磁盘测试结果
      磁盘WinMark指标反映了PC的磁盘子系统的工作性能。它的数值告诉你测试过程中磁盘的传输速率,单位是1000字节/秒,注意不是1024字节/秒。值越大表示性能越好。
      (5)处理器测试结果
      包括FPU WinMark评测分数、CPUmark32评测分数。FPU WinMark测试的输出数据是一种经过标准化的分数,只具有相对意义。通过与其他处理器FPU WinMark分数的比较,估计出你的PC的相对性能,值越大性能越好。同样的道理,CPUmark32指标反映的是与其他处理器CPUMark32分数的比较意义。
      (6)DirectDraw测试结果
      这项测试反映WinBench 99计算出的系统在15秒时间内画出的像素数。
      (7)视频测试结果
      WinBench 99视频测试提供了评测PC活动画面播放能力的具体指标。视频回放功能可以同时检测PC多个子系统,包括处理器和图形子系统,还有CD-ROM或磁盘子系统(取决于视频片断的存放位置)。
      在每次视频测试时,WinBench 99都要产生5种输出结果。在其他大部分测试项目中,WinBench 99测试结果的取值越大,表示性能越好。但在WinBench 99视频测试时,却正好相反。
      在WinBench 99返回的5项视频测试指标当中,只有最大帧播放速率可以用于与其他系统的性能做直接比较。举例来说,如果计算机A的最大帧播放速率为10,计算机B的最大帧播放速率为20,那么你就可以确定计算机B播放该片断的速率是计算机A的两倍。但是最大帧播放速率这一指标会受到CD-ROM速度(因为测试程序要从WinBench 99 CD-ROM中取得待测试的视频片断)或图形适配器的影响。
      其他4种测试指标都是用于衡量单个系统的视频性能。如果计算机A的失帧数是10,计算机B的失帧数是20,并不能说A就比B快。失帧数只能说明单个系统的视频播放存在瓶颈(通常是CD-ROM或图形适配器)。
      如果所有被测试的PC的失帧数指标都很好(接近0),你可以通过CPU利用率指标进一步区分它们。这一指标指示了播放该视频片断所消耗的CPU带宽。举例来说,假定两个系统的帧丢失数都是0,但C计算机的CPU利用率指标为10%,D计算机的利用率为50%。在这种情况下,可以说明计算机C的性能较好。因为在进行该项测试的过程中,计算机C 只使用了10%的CPU时间,意味着它有更多资源用于处理其他任务。
      除了可以利用WinBench 99做评测以外,在进行某项测试的同时,它还会自动收集系统的很多基本信息。Zdbench目录下有文件Sysinfo.ini,该文件保存了测试程序收集到的系统信息。除了系统信息对话框,程序还将收集到的系统信息收录并分类显示到多个标签窗口中。你可以选择编辑菜单中的系统信息菜单项查看这些标签窗口。下面给出这些标签的描述。
      ①Instructions说明
      此标签解释了系统信息对话框的目的和你会在标签中看到什么内容。
      ②General常用信息
      此标签显示了测试系统的基本信息(^14060102d^4)。
      ③显示设备
      此标签通过了系统显示适配器和DirectDraw设备的信息,还有实际的屏幕显示信息。下面的DirectDraw设备字段显示了在系统DirectDraw安装时收集的信息,只有在已安装了DirectDraw的情况下才会出现。DirectDraw信息是不能编辑的。
      ④磁盘驱动器信息
      该标签显示了所有驱动器数据,并用一个叹号标识出你的测试程序所在的硬盘驱动器。
      WinBench 99还可以自动填充Windows软件缓存信息,但只能适用于VFAT文件系统。你需要手工填写NTFS文件系统的缓存信息。
      ⑤环境
      此标签显示了被测试系统的当前环境变量。这些变量的值是不可编辑的。
      ⑥多媒体
      此标签显示被测试系统的CD-ROM子系统和声音播放能力。
      ⑦多媒体驱动器
      此标签显示了被测试系统上安装的多媒体驱动器信息,包括每个驱动器的一个详细描述。
      ⑧系统服务
      此标签列出了Windows NT系统中所有正在运行的服务,对于Windows 95/98系统不显示任何信息。这些信息不能编辑。标签的下方显示所有对Windows系统进程提供支持的驱动程序。在WinBench 99与其他应用程序发生冲突时,这些信息对你是有用的。
      ⑨Windows信息
      此标签显示了当前运行的Windows版本,以及多种Windows属性及当前设置。
      测试类型衡量单位
      ●磁盘WinMark和磁盘遍历测试1000 Bytes/s(1000字节/秒)
      ●访问时间 Milliseconds(微秒)
      ●CPU利用率 Percent Used(百分比,越小越好)
      ●图形 WinMark测试无单位
      ●遍历测试 Million Pixels/s(百万像素/秒)
      ●处理器 CPUmark无单位
      ●CPU利用率 Percent Used百分比(越小越好)
      ●视频显示质量 Frame Dropped(失帧数,越小越好)
      ●音频质量 Audio Breaks(声音中断次数,越小越好)
      ●最大帧播放速率 Frames/s(帧/秒)
      ●CPU利用率百分比
      ●DirectDraw遍历测试Millions Pixels/s(百万像素/秒)
      测试单位反映的信息
      ●磁盘操作回放 Thousand Bytes/s(千字节/秒)
      PC机在测试过程中的磁盘传输率
      ●磁盘读操作随机访问时间 Milliseconds(微秒)
      用微秒计算的平均访问时间,越小越好
      ●磁盘读操作CPU利用率
      从磁盘读取数据的时间占CPU运行总时间的比例
      ●磁盘读操作传输率Thousand Bytes/s
      测试时每秒读取的字节数,越大越好
      ●视频测试衡量指标提供信息
      ●显示质量帧丢失数
      PC播放测试视频片断时的持续能力
      ●声音质量音频中断次数
      PC不间断播放声音的能力
      ●时间质量百分比
      视频片断的实际播放速度与正常速度的比值。理想值为100。如果该值大于100,说明播放该片断比其正常播放占用更少的处理器时间,如果小于100,则要花更多的时间。大部分视频测试片断的正常播放时间均为15秒,只有一个为120秒。
      ●最大帧播放速率(帧/秒)
      WinBench 99尽可能快地播放视频帧(不带声音)时每秒钟的最大播放帧数,数值越大越好。WinBench 99在下列条件下的结果有所不同:如果你使用MCI接口运行视频片断(通过取消视频测试设置标签中的 ActiveMovie选项实现),而且该子系统是Windows视频系统,结果会正确返回。如果是用MCI接口运行MPEG片断,则不会产生结果。
      ●CPU利用率(百分比)
      PC花费在播放视频片断上的处理器时间比例。
      二、WinStone
      和WinBench并驾齐驱的测试软件就是WinStone,也是Ziff-Davis旗下的PC Labs出品。WinStone系列软件可分为Business WinStone、Hign-End WinStone和Content Creative WinStone三种。Business WinStone主要是针对一般商用环境,以Microsoft Office、Netscape Communicator等软件作为测试性能的依据;Hign-End WinStone则专门用来测试高级应用程序的表现,必须在Windows NT或2000操作系统上执行。Business WinStone的数据,能够代表电脑执行一般商用软件的性能;High-End WinStone的数据则代表电脑执行高级应用程序的性能。而Content Creative WinStone则针对多媒体制作环境,以Adobe Photoshop、Marcomedia Director及Dreamweaver等多媒体制作软件为主。从它测试所得的数据,可以代表电脑执行多媒体程序的性能。(^14060102e^)
      这次我们选用的是Content Creation WinStone 2000(内容制作WinStone 2000测试)软件,是ZD公司推出的一系列测试软件中比较新的一个, CCWinStone 2000的测试主要是用多种市场上最流行的软件来全面的测试PC系统的运行性能。这个软件的运行环境包括:Windows系统,测试中要用到的商用软件包括:Photoshop、Director、Dreamweaver等。在测试中,CCWinstone 2000同时打开了多个应用程序,并且在这些应用程序之间来回切换,尽量做到与用户的实际应用情况相同。测试过程中,需要大量的CPU资源和磁盘的读写,这样做的目的就是为了使整个系统尽量处于满负荷的工作状态下,这样测试后得出的结果才能真正显示出PC机在进行这一类的应用程序中的最好成绩。整个测试过程需要15分钟左右的时间,结果只有一个得分。
      安装之后,要对测试系统进行优化。首先在开始程序菜单ZD Benchmarks中运行Startup Manager,选择Disable All,关闭所有的运行程序,这样可以保证系统全部的资源都用来运行测试程序。
      在任务栏属性中选自动隐藏。重新启动计算机,整理系统盘碎片,使得磁盘文件碎片对测试结果的影响降到最低。然后就可以进行测试了。
      在开始菜单ZD Benchmarks中,运行程序,在CCWstone 2000启动的过程中,测试软件就已经在对整个系统进行检查了。进入测试的主界面后会看到有一个面板,面板上的按钮从上至下分别是:关于CCWinstone 2000、运行测试程序、存储测试结果、比较测试结果、在线帮助、退出。
      一般测试的时候,只要按下“Run”按钮,就可以进行测试了。要说明的一点是,在测试的时候不能动鼠标或者键盘,因为如果鼠标或是键盘产生信号,CPU就要对这个信号产生反应,耗费了CPU资源,影响了测试的准确性。
      在主菜单的Edit选项中有两个信息选项:System Info和Basic Info(系统信息和基本信息)。
      系统信息中显示的是系统各个方面的信息,包括硬件组成、软件版本等等。基本信息是对测试报告做出的一些标注和说明,利于以后的调用比较。
      在Edit菜单中还有一个Testing setting选项,在这里面可以对测试中的参数设置进行修改,包括选择进行测试的磁盘、测试过程中遇到错误的时候是忽略错误继续进行测试还是终止测试并且显示错误信息。
      在测试之前,如果系统仍然检测到有影响测试的程序正在进行的话,就会出现一个System Configuration Review的面板进行提醒,在面板中会以黑色钩、红和黄两色的叉进行评估。黑色钩代表不影响测试的程序;黄色的叉代表不会直接干扰测试进行但是会影响到测试结果的程序,建议关闭;而红色的叉代表能直接影响测试的程序,必须关闭。用户可以按照提示将多余的程序关掉。
      测试开始后,系统会自动进行所有项目的测试,然后得出分数。
      在测试结束后,可以将测试结果用主控界面的Save Result保存,并且用Compare Result来对测试结果进行对比。在测试结果比较中,还有很多国外品牌电脑的测试结果,可以将自己的测试结果与之对比,看看自己的电脑到底是哪方面成绩不好。
      三、3D MARK 2000
      WinBench和WinStone可以说是非常全面的测试软件。当然,对于某一些特定的硬件,还是有专门与之配合的测试软件的。用这个软件进行测试,往往能得到更好的测试效果。下面要为大家介绍的是由MAD Onion公司出品的3D MARK 2000。它可以测试CPU、主板、显卡等等的性能,就其是在显卡方面,更是权威的测试软件。
      3D MARK 2000的测试分得很细,分为游戏速度、CPU速度、像素填充率、材质渲染速度等等。另外,3D MARK 2000还为Intel和AMD处理器做了优化,并且支持Windows 2000 Professional。
      在测试之前,先要进行设置,设置面板可以对测试名称(Project Description)、测试选项(Selected Tests)、显卡和CPU(Display and CPU Setting)等进行设定。还可以用ResultBrowser对测试结果进行仔细观察。
      在测试选项面板中可以选择测试内容。(^14060102f^)一遍完整的测试需要十多分钟甚至更长的时间,所以有的朋友要是想尽快看看自己显卡的得分,可以只选GAME 1和GAME 2的测试。最后一项画质测试(Visual Test)只有在3D MARK 2000 PRO中才有。
      在测试设定面板中可以设定不显示测试信息(Disable Title screen between tests)、测试重复次数(Test repeat count)、循环测试(Looping),以及DEMO模式的有无音乐和循环。
      在显卡和CPU设定中你可以选择你的显卡、测试时的分辨率和色彩深度、Z缓冲、帧缓冲和CPU的设定。在CPU设定中可以选择Intel Pentium Ⅲ或者是AMD Athlon,(^14060102g^)这是你的CPU决定的,还有一个3Dnow!设定,仅适用于支持3Dnow!的处理器,如AMD K6和Athlon,但是如果你有一块Athlon的话,还是选择AMD Athlon吧,如果你有一块GeForce DDR一类的强大显卡的话,你还可以选择D3D Hardware T&L。这里的帧缓冲恐怕大家不是很明白,那就给大家解释一下。帧缓冲中有3个选项:Single Buffering、Double Buffering和Triple Buffering。
      Single Bufferin是使用一个前置缓冲区,影像在着色的同时立即显示在屏幕上,因此在屏幕更新影像时候会有闪烁的现象。(^14060102h^)Double Buffering是使用两个缓冲区,一个前置和一个后置,前后只是相对而言,当前置缓冲区的影像显示在屏幕上的时候,显卡正在给后置缓冲区中的影像着色,着色完后是Vsync等待的时间。就像舞台上的演出,前台演员正在演,而后台演员正在化妆一样。Triple Buffering是使用了一个前置缓冲区和两个后置缓冲区,这样在显卡给第一个后置缓冲区的影像着色完后,接着会给第二个后置缓冲区的影像着色,没有了Vsync的等待时间。这会使游戏更加流畅。
      下面我们就开始测试:
      我们可利用系统自带的游戏进行测试,有3个不同材质细节级别,每一次都会增加许多的材质细节,三角形数目越来越多,所以速度是越来越慢的。
      测试中大家不难看出LOW和HIGH的图像效果还是有很大不同的,高材质图像显现的游戏画面比低材质内容更丰富,效果更清晰。
      如果大家只想测试显卡的游戏性能的话,测到这里就可以停止了,因为这之后的测试都是些理论方面的测试了,诸如:像素填充速率、材质渲染速度、多边形生成速度、凹凸映射等等。
      CPU Speed Test(CPU速度测试)??
      这个测试的目的主要是在测试低分辨率的情况下CPU的速度。因为在低分辨率的情况下,CPU往往成了限制游戏速度的瓶颈。
      CPU MARK的分数=(GAME 1 FPS + GAME 2 FPS)×5
      Fill Rate Test(像素填充率测试)
      这个测试用来测试显卡的像素填充率,画面中有4层材质,理论上支持1通道同时处理4个材质。
      High Polygon Count Tests(多边形生成率测试)
      这项测试中有30个晃动的绳圈,每个绳圈有5000个三角形,这样共有150000个三角形,这样多的多边形在目前的游戏中已经是很有代表意义了。在3个测试中,还加了不同的光源,分别是1个平行光源、1个平行光源和3个点光源、1个平行光源和7个点光源。
      Texture Rending Speed Test(材质渲染速度测试)
      这个测试的场景是一条弯弯曲曲的隧道,在隧道的内侧分别用了8MB、16MB、32MB、64MB的材质来测试速度,在这个时候就需要128MB的系统内存了,因为是64MB的大材质呀!而且要在BIOS中将AGP Aperture Size开到128MB才能进行64MB大材质的测试。如果没有128MB的系统内存的话,会出现因为缓冲区不够用而64MB大材质无法测试的情况。
      Bum Mapping Test(凹凸贴图测试)
      这是测试显卡的3通道、2通道和1通道凹凸贴图能力的。前面几项是一般的凹凸贴图,大多数显卡都支持,但是最后一项是环境凹凸贴图。
      Image Quality Test(画质测试)
      这项测试很快,一般是看不见画面的,但可以用Result Browser(结果浏览)来观看结果。
      如果你的3D MARK 2000有Result Browser的话,就可以来观看结果了,3D MARK 2000的总的分=(Game1LowFPS + Game1MediumFPS+Game1HighFPS+ Game2LowFPS+Game2MediumFPS + Game2HighFPS)×12其实也就是几项游戏的总的得分相加再乘12,所以在游戏Game 1和Game 2的测试中分数对整体分数的影响是很大的,所以即使你的显卡不是很好,但是在低分辨率的时候分数仍然不会很低,这样导致最后结果也不会太低的,所以在分数计算方面3D MARK 2000不是很公平的。
      3D MARK 2001是该系列软件的最新版本,其具体操作方法详见本期《电脑报》C7版。
      四、QUAKE 3 Arena
      与我们上面介绍的3DMARK 2000软件不同,这个游戏使用工作站惯用的OpenGL API撰写,而非个人电脑上较常见的DirectX API。(^14060102i^)在QUAKE 3 Arena游戏中测试效能比较容易。QUAKE 3 Arena本身就有示范档案,大家不必再费心去互联网上寻找及下载。
      在测试之前,你必须先设定好欲进行测试的环境,包括显示解析度及色阶数。然后在任一画面按一下键盘“`”?烢sc键下方,数字键1左方?牐钥鬋onsole窗口。在窗口内键入“TimeDemo 1”,并按下“Enter”。然后再键入“Demo Demo001”或“Demo Demo002”,再按下“Enter”。QUAKE 3 Arena游戏就会开始载入并播放,播放完毕会返回主选单画面。
      播放完毕后,按一下键盘“`”开启Console视窗,就会看到刚才播放示范档的速率了。由于QUAKE 3 Arena使用OpenGL API,因此它测得的效能,可以被视为显示卡在执行OpenGL程序(如3D Studio MAX),或游戏的效能指标。
      除了上述这几套软件或游戏外,当然还有不少软件或游戏也可作为测试效能的用途,例如3D WinBench、MDK2游戏等。不同的硬件需用不同的软件或游戏来进行测试,主机板或系统就以WinStone或Content Creation WinStone最适合。显示卡则以3DMark 2000、QAUKE 3 Arena游戏来测试为佳。
      五、CD Speed 99
      CD Speed是个很简单的测试光驱的软件,主界面如下图:(^14060102j^)
      测试结果分为速度测试(Speed)、DAE质量测试(DAE quality)、寻道时间测试(Seek Times)、CPU占用率测试(CPU Useage)、冲击传输测试(Burst)、电机起速和降速时间测试(Spin up&Spin down)。
      菜单栏中的Extra里有一项驱动检查(Drive check),运行后可以检查出关于驱动的很多信息。
      除了以上介绍的评测软件以外,其实还有很多比较专业的评测软件与游戏,如WinTune、DVDSpeed、Unreal Tournament等等,我们只是挑选其中比较常用的来介绍,至于其他,就留待读者自己挖掘了。学会了使用评测软件及分析评测结果,你可以说离制作完整的评测报告只一步之遥了。评测报告都有其固定的格式和套路,只要你认真解读分析,依葫芦画瓢应该不会太难。下面,就进入我们的阅读撰写评测报告。