测试软件大看台
评测与市场
随着2002年的到来,《电脑报》迎来了又一个新年的第一期。评测室的编辑们考虑到由于评测版的特殊性,我们的工作主要是放在硬件产品的评测上面,这样一年下来,相关的评测报告粗略算一下也有一两百篇。对于这些内容各异的评测报告,也许有一部分读者对其中使用的评测软件非常感兴趣,而我们全年的报纸中,对于测试软件的介绍相当少,因此在新年第一期中我们决定补上这一课,为大家介绍一些常用的,同时也是业界公认的标准测试软件。
这次我们要为大家介绍的测试软件还是以我们平常经常使用的测试软件为主,这些测试软件使用频率非常高,像ZD Media Business Winstone2001、Content Creation Winstone 2001、WinBench 99、3D Winbench 2000、3D Mark2001以及SPECviewperf 6.1.2等,接下来,我们就这几个测试软件为大家做一个简单的介绍。
Business Winstone2001
Business Winstone2001是我们过去使用的Business Winstone99的最新版本,作为系统级的基于实际应用的测试软件,它能全面反映电脑在Windows98、Windows2000或者WindowsNT操作系统下,运行当今最流行的Windows应用软件时的整体性能表现,在行业内习惯称这些软件为商业应用软件,而实际上绝大多数是办公应用软件,Business Winstone2001运行这些商业应用软件并不是从头至尾运行一遍,而是通过运行一系列定制的脚本程序,即这些商业应用软件中的部分应用代码,通过计算完成这些脚本的时间来得出整体性能分值,而且测试时实现了多个程序同时打开,并不停地在这些应用程序之间切换。(图1)

与Business Winstone99相比,Business Winstone2001测试中用到的商业应用软件不仅进行了全面升级,而且增加了项目管理、病毒扫描、文件压缩/解压缩以及E-mail应用,测试项目更加完善,更能反映目前绝大多数用户在日常实际应用中的软件环境。
Business Winstone2001用到的测试套件:
·Symantec Norton Antivirus 2000
·Winzip 7.0
·Microsoft FrontPage 2000
·Lotus Notes R5
·Microsoft Access 2000
·Microsoft Excel 2000
·Microsoft PowerPoint 2000
·Microsoft Project 98
·Microsoft Word 2000
·Netscape Communicator 4.73
读者可能注意到,Business Winstone99之后并没有经过Business Winstone2000就直接升级到Business Winstone2001,这是因为Ziff Davis Media在开发Business Winstone2000的过程中遇到一个致命的问题──如何确保测试结果的准确和可以完全重复出现(在相同测试环境条件下),几乎所有的问题往往与特定测试系统的软硬件配置密切相关,而且更进一步发现像Windows98、Windows2000这样全面优化的现代操作系统,即使每次执行之前进行严格的磁盘整理然后重新启动,操作系统往往都不会以完全相同的方式去执行相同的任务。
针对这样的情况Ziff Davis Media在设计Winstone2001时做了比较大的改变,使用了全新的通用用户界面和内部框架,使Business Winstone2001可以连续运行五遍,然后根据每次测试的成绩得出最后成绩,而且指定运行的第一次作为练习测试,不会列入最后成绩,最后成绩则取后面四次测试中的最高成绩。测试完成后用户界面会把最后成绩以及每一遍测试的成绩一一显示出来,并且你可以指定测试结果的误差率(例如3%),如果几次测试的结果相差太大,超过指定的误差率,测试结束后会自动弹出警告提示窗口。测试者如果为了节约时间也可以根据需要改变测试的次数,甚至取消第一次练习测试。该软件可以指定系统自动进行磁盘整理和重新启动。
Content Creation Winstone 2001
Content Creation Winstone 2001是Content Creation Winstone 2000的升级版本,同样是一个系统级的基于实际应用的测试软件,不过与Business Winstone2001不同的是,Content Creation Winstone 2001更专注于系统在运行Web工具、打印和多媒体(2D、3D、视频、音频)内容创建这些要求更苛刻的高端应用时的性能表现,Content Creation Winstone 2001因此取代了High-End Winstone99的位置成为测试电脑系统在高端应用方面整体性能表现的最好软件。测试的方法和Business Winstone2001比较近似,只是用到的应用软件不同,与Content Creation Winstone 2000相比,大多数应用软件都已经升级到了较高的版本。
Content Creation Winstone 2001用到的应用软件:(图2)

Adobe Photoshop 5.5 (从5.0升级)
Adobe Premiere 5.1
Macromedia Director 8.0 (从7.0升级)
Macromedia DreamWeaver 3.0 (从2.0升级)
Netscape Navigator 4.73 (从4.6升级)
Sonic Foundry Sound Forge 4.5
而且随着大容量缓存硬盘的流行,为了避免Content Creation Winstone 2000的数据文件已经适应了这些大容量缓存硬盘,而导致测试结果不能够很好地反映内容创建时系统的真实性能,所以在Content Creation Winstone 2001中增加了一些额外的内容,例如在PhotoShop中不仅增大了文件容量,而且文件中用到了Gaussian blur、dust and scratches、unsharp mask filters等特效。
除此之外Content Creation Winstone 2001也和Business Winstone2001一样,使用了新的通用用户界面和内部框架,可以运行5遍得出最后成绩,并且可以指定系统自动进行磁盘整理和重新启动。
从实际测试的情况来看,Business Winstone2001和Content Creation Winstone2001两个软件的测试过程都非常漫长,分别需要两三个小时,而且对系统稳定性的要求更加苛刻,但测试结果的准确性大大提高。
WinBench 99 v2.0
WinBench 99也是ZD Media系列经典测试软件之一,不过WinBench 99是一个子系统级的测试软件,主要用来衡量Windows 环境下PC的图形、磁盘以及视频等子系统的性能,目前的最高版本为2.0。(图3)

WinBench 99 v2.0延续了从WinBench 99 v1.0到 v1.2以来的风格,不过与以前的几个版本相比,WinBench 99 v2.0也有不少的变化。一是,WinBench 99 v2.0在测试项目上取消了处理器部分的测试,而相应地加重了图形、磁盘等在整个测试中的比重。二是,新的WinBench 99 v2.0采用了与Business Winstone2001和Content Creation Winstone 2001完全相同的用户界面和内部框架,因此它很容易地与其他目前ZD Media最新的系列产品融合在一起,同样可以控制运行次数,并且也可以指定系统自动进行磁盘整理和重新启动,测试的准确性大大提高。
3D Winbench 2000
3D Winbench 2000也是ZD Media系列中的一个经典测试软件之一,由于它的功能十分强大,测试内容非常丰富,因此直到现在,其严谨性和全面性在显示卡测试领域依然占据着不可动摇的地位。
在核心技术上,3D WinBench 2000支持DirectX 7.0技术,同时还引入了先进的T&L(文件传输和光影转换)技术特性。除此之外,3D Winbench 2000还提供了更多的品质测试,包括凹凸贴图,各向异性(Anisotropic)过滤,DXTn纹理压缩等。如果在测试时使用带有AMD 3D Now!或Intel MMX、SSE等多媒体扩展指令集的CPU,还能提高3D Winbench200的运行速度和画面效果。目前,3D Winbench 2000的最新版本为1.1版,修正了使用界面、文件运行和压缩贴图、凹凸贴图测试中可能出错的小问题。(图4)

3D WinBench 2000运行所需要的硬件和软件环境要求:
1.微软Windows 98、SE和Me版,Windows 2000 RC2或更新版本的操作系统(并不支持传统NT系统)。
2.使用Pentium或速度更快的处理器(包括AMD等兼容处理器)。
3.128MB系统内存(3D WinBench 2000可以在64MB或更少内存的系统上运行,但是测试项目和结果将大打折扣)。
4.约300MB的硬盘安装空间,需70MB的硬盘空间用来运行品质测试。
5.一块至少有4MB显存的3D显示卡,能在800×600@75Hz分辨率下保证16位色,最好能在1024×768@75Hz下流畅运行。
6.系统必须安装DirectX 7.0或更新版本(如DirectX 8.0及8.0a)。
3D WinBench 2000的测试主要包括两个关键部分:3D质量测试(3D Quality)和3D分数测试(3D WinMark 2000)。
3D Quality可以算是3D WinMark 2000的前奏曲,第一次运行3D WinBench 2000时都必须先进行3D Quality测试。3D Quality中包含了多达69个3D质量测试项目,这些测试项目主要是帮助程序和用户了解显卡硬件的实际性能。
3D WinMark2000共分为9个测试场景,分别是Speedway、Hangar、Rust Valley、Canyon、Chamber、Stations、Islands、Race Track以及Chapel,其中有一项需要三线贴图过滤,而其他8项则使用双线贴图过滤。同时,它们都支持T&L技术,既有对三角形数量的测试,也有对光影、雾化、镜面等特效的测试。测试中的场景画面将按预定的轨迹运行,同时程序自动计算每秒钟的运动速度(即帧数)。测试结果可充分反映被测显卡的性能,特别是游戏性能的主要指标(即像素填充率和三角形生成速率)。但和3D WinMark 99中累计得分的计算方法不同的是,3D WinMark 2000得分是从这9个测试场景帧率(前1/4秒的平均值)的平均值中分析获取的,这样更能全面客观地测试出显示卡的实际能力。
SYSmark2001
SYSmark2001是MadOnoin公司著名的SYSmark系列测试软件的最新版本,和Business Winstone2001和Content Creation Winstone 2001相似,SYSmark2001也是一个系统级的基于实际应用的测试软件,不过SYSmark2001更为强调了办公应用和Web开发两个方面的内容。
新版本的SYSmark2001引入了一种被称为“a day in the life”的概念,就是模拟一个办公用户或者一个Web开发者一天的工作的方式来定制测试环境,因此其场景的编排不仅完全按照实际操作来定制,而且场景轨迹也完全按照真实的操作速度来进行,因此其测试过程与以往的版本和其他的测试软件有明显的区别,这是我们进行SYSmark2001测试后感受最深的地方。另外,为了打造一种真实的系统环境,SYSmark2001不仅对测试中用到的商业应用软件进行了全面升级,而且还新增加了E-mail应用、文档压缩、数据库管理、病毒侦测等方面的内容,测试项目更加完善,更贴近绝大多数用户日常实际应用中的软件环境。
SYSmark2001中新加入的应用软件:
Outlook 2000
WinZip 8.0
Access 2000
McAfee VirusScan 5.13
Macromedia Dreamweaver 4
Macromedia Flash 5
SYSmark2001的测试项目主要分为两个方面:Office Productivity 和Internet Content Creation。Office Productivity项的测试内容主要是根据人们的实际办公环境来设定的,测试中将会涉及到许多办公软件的应用,像Microsoft Word 2000、Microsoft Excel 2000、Microsoft PowerPoint 2000、Microsoft Access 2000、Microsoft Outlook 2000、Netscape Communicator 6.0、Dragon NaturallySpeaking Preferred v.5、WinZip 8.0以及McAfee VirusScan 5.13等,这些软件都是办公环境下使用最频繁的软件,由此可见SYSmark2001的仿真度相当高。(图5)

SYSmark2001的Internet Content Creation项测试则完全是按照Web开发环境定制的,测试中,SYSmark2001将到制作Web页的全过程,将涉及到图片处理、Flash制作、视频音效处理等一系列操作,复杂程度与真实的Web开发没有两样,比较真实地考察了硬件在Web应用方面的性能。
从实际测试的情况来看,由于SYSmark2001引入了“a day in the life”的概念,因此其测试过程相当漫长,通常需要1小时以上。另外,SYSmark2001对硬件配置的要求也相当高,如果没有P3 600MHz以上处理器,2GB以上的空间,128MB以上内存,我们奉劝你还是不要试,否则你将自找苦吃。
3D Mark2001
3DMark系列是由MadOnoin公司出品的3D显卡测试软件,自问世以就来受到了显卡DIY界的广泛欢迎。3Dmark系列采用了未来派第三视角游戏MaxPayne的MAX-FX技术,力求在真实游戏环境中为你提供系统的3D性能测试。而且界面直观,使用简单,测试覆盖面广且针对性强,能有效地测试出3D显卡的D3D效能,因而被许多权威媒体和网站所推崇。(图6)

3DMark2001系列作为3DMark系列家族中的最新版产品,除继承了3D Mark2000的诸多优点外,还新增了不少测试功能。它采用的MAX-FX技术,可对目前主流显卡(如GeForce2、GeForce3以及Radeon8500等系列)和Microsoft DirectX8技术予以完善的支持。目前,3DMark 2001系列分为标准版及Pro版两个版本,前者为共享形式,可在网络上自由下载使用,但部分功能将受到限制;后者拥有全面的设置栏目和完善的测试功能,但必须通过购买或注册后才能使用。(图7)

3D Mark2001的新特性:
·支持Microsoft DirectX8;
·支持DirectX8硬件加速特性;
·为最新的Intel和AMD处理器进行了优化;
·支持DirectX8的Vertex Shaders(顶点阴影渲染)和Pixel Shaders(像素阴影渲染)测试;
·支持DOT3(矢量像素)和(Environment Mapped Bump Mapping)环境凹凸贴图测试;
·支持全屏反锯齿和材质压缩;
·全新的在线结果浏览功能。
另外,随着版本升级,3D Mark2001中内置的场景也越来越华丽,许多场景是通过即时演算生成的,并加入了T&L光影转换效果,因此其效果可以与一些经典游戏中的CG画面相媲美,有机会读者可以亲身感受一下,相信会给你带来相当大的震撼。
Video 2000
Video 2000也是由MadOnoin公司出品的一款显示测试软件,和3DMark 2001不同的是,Video 2000并不侧重于显卡游戏功能的测试,而是一款测试评估显示卡DVD回放和MPEG2解码、视频编辑方面性能的软件,测试的是以显卡和CPU为主的系统整体性能。(图8)

Video 2000的特性:
·全面支持DirectX 7.0技术;
·分析和测试PC系统在视频编辑、DVD回放和MPEG编码方面的能力;
·带有Result Browser 2000数据浏览工具,使得你可以在数据库中收集和创建测试数据(Pro版支持);
·与Faroudja公司一同开发,加上超过25家厂商的测试,保证最佳的测试方法和兼容性;
·可以集中测试出在DVD、MPEG-2视频编码和解码、HDTV、视讯会议和家庭影院方面的性能;
·能分析所有情况下视频回放质量的先进画面质量测试;
·完全彻底的图形子系统性能分析,可以评价出图形子系统的局限性和额外特点;
·真实的MPEG-2编码测试和视频解码质量测试,可以测试出CPU在软件视频压缩方面的性能。
Video 2000的界面与3DMark系列类似,测试项目包括基本测试项目(Normal)和品质细节(Quality Detail)两个方面。其中,基本测试分为三个方面:性能(Performance)、品质(Quality)和特色(Features)。
性能测试主要以AGP数据传输速度测试为基础,测试显示卡的静态图形缩放、内存(显存)数据传输(测试从主存,非主存和系统内存到AGP的读写速度)和DVD回放(测试CPU占用率和一系列不同波特率的MPEG2回放)。
“品质”测试是评估图形卡产生数字视频图像的能力,它涉及到图形缩放(上下定标), DVD MPEG2解码和色彩空间转换、交错消除等。其中交错消除测试中包含线条闪烁(Line Flicker)、羽状条纹(Feathering)、双影(Double Imaging)、3∶2折叠(Pulldown)测试,可多次循环测试。
“特色”功能则是测试用户显示卡在数字视频方面的特点,如回放色彩、画面控制、RGB/YUV转换及其他一些数字技术等。
不过,由于其中大部分操作步骤都需要用户配合测试程序才能顺利进行,降低了测试的流畅性,同时它还缺少对DVD播放设备的详细测试(如传输速率及CPU占用率等),另外该版本的软件似乎还缺乏对RM及MPEG4等新型播放格式的支持等。但是,Video 2000以其强大丰富的功能,仍不失为一款好的数字影像测试软件。
SPECviewperf 6.1.2(图9)

图9

在专业3D设计方面的性能表现,我们通常会采用目前业界公认的SPEC viewperf 6.1.2专业OpenGL测试软件进行测试。SPEC viewperf 6.1.2的独特之处是应用OpenGL驱动的方式实时渲染viewport ,并作出可视化结果。这种专业3D设计和普通游戏最大的区别在于,3D游戏强调尽量快的fps帧数情况下渲染出绚丽真实的游戏画面,所以往往采用相对较少的三角形(多边形),一般在数万水平,并采用大块的纹理来覆盖,并且用到一些特殊视觉效果。而这些在专业3D应用中却用不上,专业3D应用强调与真实物体的逼真性,所以往往采用数目庞大的三角形数以逼真再现实物的每一个细节。三角形数量通常在数十万以上,有的甚至可以达到几百万。因此,我们可以发现,虽然一些主流显卡在游戏中跑得很顺畅,fps帧数很高,但在SPEC viewperf 6.1.2中却跑起来非常吃力,这就是专业3D设计与普通应用最大的区别。
SPEC viewperf 6.1.2的测试选项非常简单,共分6项,可以单独地测试某一项,也可以一次运行所有的项目。浏览结果也非常方便,测试完成后,SPEC viewperf 6.1.2会自动生成一个文档,分别列出每项的测试成绩,简单明了,用户一看就懂。
由于篇幅的限制,这次我们介绍的测试软件就这么多。这其中包括了目前使用最频繁的ZD Media系列整机性能测试软件以及玩家使用最多的3D Mark2001。如果你有机会,请亲手试一下。这篇文章虽然不能使读者们的测评知识变得专业,但你可以依样画葫芦,大致评价和测试一下自己的系统,或者再次看到有关评测的数据时,不至于像一个“门外汉”一样摸不着头脑,而是能更清楚地了解到更深层的意义,体验到其中的乐趣。