打开3D狂野之门——GeForce2 GTS显卡横向测试

Author: 电脑报评测实验室 Date: 2000年 第27期

    自5月底NVIDIA发表第二代GPU 3D加速芯片GeForce2 GTS后,全球各大显卡厂商及台湾的大量传统主板厂商纷纷发表了采用该芯片的新一代显卡,在各款产品纷纷开始上市之际,我们电脑报评测实验室组织了这次GeForce2 GTS显卡的大型横向测试,帮助读者深入全面地了解GeForce2 GTS以及不同品牌GeForce2 GTS显卡的特点,提供最全面的选购指南。由于我们在5月22日《青出于蓝而胜于蓝——GeForce2 GTS显卡评测报告》一文中已经详细介绍了GeForce2 GTS的规格,这里我们将重点放在GeForce2 GTS的功能性能分析,尤其是和其他芯片的比较测试以及不同品牌GeForce2 GTS显卡的比较测试上。
#1    再次了解GeForce2 GTS芯片
#1    ● GeForce2 GTS规格
    NVIDIA半年前推出的GeForce256以强大的性能、完善的驱动、丰富的3D效果、精美的画面效果几乎成为显卡市场的独尊,如今的第二代产品GeForce2 GTS除了具备第一代的强大性能外,增加了部分新特性并做了进一步改进。(^27070201i^)
    ⊙采用更为先进的0.18微米制造工艺,不仅使核心频率从GeForce256的120MHz提升到200MHz,而且减少了功耗(只有10W),减少了发热量,极大地改善了散热及系统稳定性;
    ⊙进一步改进T&L(Transform Engine and Lighting Engine)引擎,即所谓的第二代T&L引擎。增加了硬件级材质剪裁功能(Hardware Clipping)和单像素光照运算(Per pixel Lighting),支持一些更先进的3D效果,像“单像素凸凹材质效果”Per-Pixel Bump Mapping、“单像素渗透光照效果”Per-Pixel Diffuse Lighting 、“单像素镜面反射效果”Per-Pixel Specular Lighting等;
    ⊙改善NSR渲染引擎(NSR NVIDIA Shading Rasterizer),以实现一个时钟周期8个材质的处理(而GeForce256只有单周期4个材质的处理能力),理论峰值像素填充率达800 megapixels/sec,峰值材质填充率达1600megatexels/sec,这也是GTS即Giga-Texel Shader的含义所在。
    ⊙三角形生成速度达2500万triangles/sec,比GeForce256的1500万triangles/sec提升40%,进一步完善硬件反锯齿功能,即硬件全屏幕反锯齿FSAA(Full Scene Anti-Aliasing),使游戏画面在低分辨率下面更加柔化,减少画面线条的锯齿状效果。
    ⊙支持主要的材质压缩格式,包括DirectX的DXTC和OpenGL的S3TC(S3 Texture Compression),进一步提高大材质高负荷游戏的处理效能,也符合未来游戏清晰画面巨型材质的潮流。
    ⊙集成了下一代高清晰视频处理器High Definition Video Processor(HDVP),提供MPEG2数据流(DVD或HDTV信号)的硬件辅助译码,支持完整的HDTV标准,支持HDTV信号的回放和Timeshifting。支持NTSC/PAL TV 输出编码。
    ⊙支持AGP 4×,并且支持边带寻址和快写模式
    ⊙350MHz RAMDAC
    ⊙只支持DDR显存(SDRAM&SGRAM),目前推出的Geforce2 GTS主要分32MB和64MB两种,前者完全采用DDR SGRAM,后者我们已经看到有厂商采用DDR SDRAM,也有采用SGRAM。
#1    ● GeForce2 GTS性能分析
    从GeForce2 GTS和其他3D芯片的规格比较表可以看出,GTS的材质填充率是目前包括VOODOO5在内所有3D芯片中最高的,不仅大约是GeForce256的4倍,而且也高出VOODOO5 6000不少,而GTS的显存带宽也仅次于VOODOO5 6000,从规格上看显得异常强悍。
    显卡的峰值填充率和显存带宽是影响显卡性能的两个重要瓶颈。更高的填充率将使显卡在更高分辨率下保持高速的FPS性能。例如:显示分辨率1600×1200下,每帧的像素数为1920,000,如果希望得到100FPS的速度就必须要480,000,000 pixels/sec 的像素填充率(Z-buffer使用平均2.5×pixel复写),显然这样的填充率已经达到了GeForce256的极限。而目前许多新游戏都使用了多材质multi texturing,所有的象素有可能需要两个材质,那么FPS将立即从100降到50,因为每个像素都需要两个时钟周期才能够完成两个材质的处理。但GeForce2 GTS由于在每个管线上一个时钟周期可以一次性地处理两个材质,这样即使是在高分辨率下也可以保持性能不下降。所以在像Quake 3这样的多材质游戏中,材质填充率非常重要,GeForce2GTS将凭借高材质填充率占尽优势。
    另外,显卡的理论峰值填充率很有可能受到显存的访问瓶颈限制而无法全部发挥出来。当显存材质传输速度由于显存带宽限制慢于3D芯片处理速度时,3D芯片将经常处于等待状态,从而使处理效能受极大钳制。从中我们可以发现GTS的显存带宽5.2GB/sec(DDR SGRAM数据传输通道为16Bit,333MHz的DDR SGRAM带宽则为333×16MBit=5328MB/sec,5328/1024=5.2GB/sec)比前一代产品DDR的4.8GB/sec只增加了一点点,在DDR的测试中我们就已经发现高分辨率高色深(32bit)下性能受显存带宽的制约比较明显,显存带宽成为瓶颈,如今GTS填充率成倍提高,而显存带宽却提升较小,看来显存带宽瓶颈仍然没有得到较好的解决。
#1    参测样品一览
    这次测试除了耕宇送来了64MB的GTS外,其余7家公司都是提供的32MB DDR SGRAM标准版本,从品牌上看,囊括了中国大陆市场上各重要厂商,包括华硕、创新、大力神、丽台、艾尔莎、讯英、耕宇、微星。从参测的7款32MB GTS来看,外观极为相似,除了大力神把部分电路移到显卡尾部外,其他各公司完全是按照NVIDIA的公版设计的,包括选用的电阻、电容都几乎一样(规格一样,品牌品质有差异),全部采用双面设计;全部采用Infineon的-6 ns DDR SGRAM,甚至芯片的批号都一样,正面和反面各4颗;全部将核心频率和显存频率分别设定为200MHz、333MHz标准频率;所以这一波GTS显卡除了从PCB板颜色、散热装置以及品牌标志区别外,你很难说出哪块卡是哪个公司的。
#1    ● 华硕ASUS AGP-V7700 GeForce2 GTS
    作为NVIDIA的坚定合作者,ASUS以极快的速度推出了GTS显卡——AGP-V7700 GeForce2 GTS。V7700采用华硕传统的金黄色的PCB板,比较独特的圆形散热片/散热风扇,风扇转速比普通风扇5000RPM快一点(5500RPM,V7700风扇是这次参测GTS显卡中唯一提供第三根风扇转速监控线的。我们注意到在卡的背面与众不同地增加了一颗很小的监控芯片Winbond W83781D,可以同时监控散热风扇转速、3D芯片内部温度以及供给电压,非常方便。V7700的驱动程序也提供了动态超频功能,从测试的情况来看,华硕AGP-V7700超频能力不错,内核与显存时钟频率最高能达到240/390MHz。华硕除了提供一块做工优良的GTS显卡和一张驱动盘,它还附赠了一张名为ASUS DVD2000播放器的光盘,两张3D游戏盘:Rollcage和Drakan。(^27070201a^)
#1    ● 创新 3D Blaster Annihilator 2
    创新的这块采用绿色的PCB板,预留了S-Video端子和 TV输出接口位置,可以选装附加子卡。散热风扇与GTS芯片接触紧密,散热效果良好。同创新的声卡一样,3D Blaster Annihilator 2的驱动程序以及提供的BlasterControl4.0桌面管理工具也非常有特色。界面非常酷,除了提供超频选项和D3D刷新同步开关外,还提供了AGP边带寻址以及快写模式选项。不过快写模式并不能够打开,而且创新的超频工具只允许超显存,最高值为384MHz,这块卡基本上能够超到这一极限,但花屏严重。创新也提供了WinDVD光盘。(^27070201b^)
#1    ● 艾尔莎 ELSA Gladiac GeForce 2 GTS
    老牌显卡厂商艾尔莎的这块Gladiac GeForce 2 GTS采用绿色PCB板,很明显是公版设计。PCB上标明“Rev. B”,显然已经是第二个版本,但外观仍然和GeForce 2 GTS参考板(估计也是ELSA和NVIDIA合作设计)完全相同,可以选装附加子卡。超频不错,可以在不加任何额外散热措施的情况下内核和显存超频可以达到240/375 MHz。(^27070201c^)
#1    ● 耕宇 64MB Gainward GeForce2 GTS
    耕宇的这块GTS卡显采用公版设计:绿色PCB板,采用现代HYNDAI 64MB 6ns DDR SDRAM,八片显存每两片一组分布,在GTS芯片的上方和右方各有两组四片。这是一块工程样卡,厂方称正式产品都采用5.5ns或5ns的显存。显卡芯片上采用了与华硕相同的圆形大风扇。除了标准的HD-15显示器接口,耕宇还在卡上提供了DFP (数码平板显示器Digital Flat Panel) 接口,并预留了TV输出的接口。其超频性能很不错,内核和显存时钟可达到235MHz/400MHz。(^27070201d^)
#1    ● 大力神 Hercules 3D Prophet Ⅱ GTS
    大力神是美国一个历史非常悠久的显卡设计制造商,最近被Guillemot收购,3D Prophet Ⅱ GTS则是收购后的第一款产品,也是本次测试中唯一一款非公版设计的GTS显卡。这块卡采用蓝色PCB板,由于部分电路被移到了PCB的尾端,所以比公版设计稍长,而且每颗显存都贴了与PCB同色的散热片,并在卡上集成了TV输出部分而非采用子卡设计,整块卡显得做工精美,上档次。尽管在显存上贴有散热片,但Hercules 3D Prophet Ⅱ GTS的显存超频能力并不算突出,内核和显存能超频到219MHz/360MHz。它提供完整的英文安装说明引导程序和英文驱动程序,遗憾的是目前还没有中文驱动程序。驱动光盘上捆绑全版本Power DVD和一些GAME DEMOS。(^27070201e^)
#1    ● 丽台Leadtek Winfast GeForce2 GTS
    显卡生产大厂丽台也推出了基于GeForce2 GTS的产品——Winfast GeForce2 GTS。它仍是黄色PCB公版设计。唯一独特之处是处理芯片上采用的巨型散热片是普通散热片的两倍,以至覆盖到了部分显存芯片上。卡上带有TV输出附加子卡,子卡上集成常见的CONEXANT协处理芯片来管理TV输出信号,但没有提供DFP(数码平板显示器Digital Flat Panel)接口。丽台的GTS超频性能异常出色,内核频率和显存频率最高可超到240/410MHz。并且提供中文的驱动程序。(^27070201f^)
#1    ● 微星 MSI MS-8815
    微星的GTS显卡采用公版设计,黄色的PCB板。采用了品质较好的ADDA散热风扇。板上没有TV输出接口插座,这块卡无法使用TV输出功能。驱动程序基于公版设计,主要是界面改为微星特有的3D!TurboⅡ界面,操作调节十分方便。内核和显存时钟可达到235MHz/390MHz。(^27070201g^)
#1    ● 讯英 SAVANT CGTS2
    讯英送来的这块GTS显卡采用,公版设计,黄色的PCB板,从PCB的标志看,PCB板应该和华硕出自同一家工厂。在PCB板的背面,比公版少焊接几颗电阻在板上。不过在使用过程中并没有发生任何的问题。它的超频能力很强,内核和显存时钟可达到240MHz/390MHz。(^27070201h^)
#1    全面解析GeForce2 GTS
    由于这次测试我们不仅要考察32MB&64MB GeForce2 GTS与GeForce256 32MB DDR、Savage2000的性能差异,而且,要对7款32MB DDR GeForce2 GTS进行横向测试。测试工作量极大,所以我们设计了两个测试平台同时测试。
    测试平台一:MSI 815E Pro M/B+Intel Coppermine733(550o/c 132×5.5)、GEIL PC133 128MB SDRAM、Quantum Fireball LM 20.GB、LG795FT
    测试平台二:Soltek SL-77V KX133M/B+Athlon600、HY PC100 128M SDRAM、Aureal SQ2500、Maxtor 54098U8 40GB、MAG 765FD 在测试平台一上进行8款GTS的横向测试以及GTS各项功能考察测试(反锯齿、硬件T&L等),测试平台二进行GTS和Geforce256以及Savage2000的纵向比较测试。(说明:这次测试数据量太大,由于版面限制,GTS横向测试的数据和部分16bit色分辨率下的测试数据不能全部刊登)
#1    1.选择最合适的驱动程序版本
    在正式测试以前我们对驱动程序进行了考察。从各参测显卡所附带的驱动程序来看,ELSA、Creative、Guillemot&Hercules、ASUS、Leadtek等公司,都开发了自己的专用驱动程序,不仅把显示属性菜单设计成自己独特的风格,实现了中文化,而且附加了超频、D3D刷新同步开关等选项,使用更加方便。考虑到各公司发布自版驱动程序的进度不一样,在我们测试接近尾声时,部分研发实力较强的公司,已经发布5.30版的驱动程序了,而大多数公司还停留在5.16版甚至更低的版本。如果采用他们自己的驱动程序势必造成性能的极大差异,并不能够真实反映显卡实际性能。而且如今的用户通过各种渠道都可以得到最新版本的标准驱动程序,所以我们这次统一采用了标准版的驱动程序。
    为了考察不同版本驱动程序的性能情况,我们在平台下面分别对5.13、5.16、5.22、5.30版本驱动程序进行了比较测试。从测试情况来看,尽管5.13版驱动程序性能表现最好,但毕竟发布时间较早,对GTS新特性的支持度较差,在DMZG测试中出现大量贴图错误和闪烁情况,所以没有采用。而最新发布的5.30版驱动程序由于不是正式版本,而且在部分测试中比5.22版驱动程序成绩还差,所以也没有采用。而5.22版和5.16版驱动程序的成绩比较接近,但5.22版在全屏幕反锯齿方面更加完善,所以我们最后采用了成熟度较高并且性能表现良好的5.22版驱动程序作为7款GTS横向比较测试的驱动程序。但总的来说NVIDIA的驱动程序是目前各3D芯片研发厂商中设计最完善,bug最少的。
#1    2.优秀的2D性能
    关于2D性能,其实从TNT2那一代产品开始就已经达到了相当高的水平,已经超过了实际应用水平。拥有32MB DDR的Geforce2 GTS支持最大2048×1536×32bit的2D&3D显示,并且350MHz RAMDAC可以完全保证即使是1600×1200×32bit超高分辨率下85Hz的刷新率,即便是21英寸的大显示器上也可以保证清晰锐利的显示。从ZD Winbench99商用及高端图形部分的测试成绩来看,GTS的分值(297/838)还略低于GeForce256(304/863)。不过,GTS、256DDR以及Savage2000(288/803)都基本处于一个水平上。
#1    3.强大的3D性能
    【D3D性能】
    ● ZD 3D Winbench2000
    ZD 3D Winbench2000包括严格的3D品质检测,像反锯齿、凸凹贴图等共69项3D效果,又包括3D性能测试。不过从3D品质测试来看,尚未包括进GTS新增加的单象素渗透光照效果、单象素镜面反射效果等特效。所以支持的3D效果数量和256 DDR完全一样,但性能分值不管是在16bit还是32bit都远远超过256 DDR,性能提升30%,在16bit模式下超出Savage2000一倍多,32bit模式下也是Savage2000的近1倍。从参测的7款32MB GTS显卡来看,分值非常接近,基本上是88.8、88.9这两个分值,难分伯仲。
    ● 3DMark 2000(见表格3DMark 2000)(^27070201j^)
    3DMark 2000能够较全面的检测出显卡的D3D性能,可以判断显卡在D3D下面的图形品质、游戏流畅速度、图形多边形填充速率等。在测试中,使用了D3D硬件 T&L加速,在32位色深3种高分辨率下 GTS的3D Mark值都远远高出256 DDR近1000分,性能提升都在20%多,填充率高出256 DDR近100(M)个/秒,提升幅度也在20%左右。显然在高分辨率下GTS受显存带宽限制,高填充率并没有完全发挥出来。而Savage2000的3D Mark值还不及GTS的一半,游戏速度和图形填充率也差不多低了一半。这次参测的7款GTS 32MB尽管从结果上看有几帧的差异,但差距都在0.5%以内,完全在测试误差范围内,尽管如此,丽台GTS还是在三个分辨率下都取得最高分。而64MB的Cainward GTS因为配置较高,分数略领先于32MB的显卡。(^27070201o^)
    ● DMZG(表格:DMZG)(^27070201l^)
    DMZG是一款专为GeForce系列芯片“量身定做”的D3D游戏。它着重检测显卡的硬件T&L功能和纹理、像数的填充率。在测试中我们发现,DMZG对显卡的负荷要求极大,在我们的平台下即使在最低分辨率下也没有像其他测试软件一样表现出CPU瓶颈现象。GTS的T&L性能和渲染功能十分强大,在各种分辨率下都可以超出256 DDR 10帧,甚至在1600×1200×16bit模式下也保持了40FPS的流畅。GTS 64MB在平台一上的成绩很正常,但在平台二上却慢了一些,估计是BIOS的关系。
    【OpenGL游戏性能】
    ● Quake3 Test(表格:Quake3)(^27070201m^)
    Quake3作为多材质运用的典型OpenGL DEMO已经成为检测3D性能的必用测试软件,我们使用了包括DEMO001、DEMO002、NV15DEMO以及QUAVER在内的四个测试场景,除了16位色深800×600分辨率以下以及32位色深640×480分辨率模式下,受CPU瓶颈限制GTS和256拉不开距离外,其他分辨率下GTS都明显高于256,提升幅度在25%左右,在1600×1200×32bit下差距还要大些,达到30%。Savage2000除极少数分辨率略高于GeForce256 32MB SDRAM外,其余成绩都不够理想,尤其在高分辨率下被拉开的距离更远。从7款GTS 32MB的测试成绩来看,高分辨率32位模式下成绩同样几乎一样。CainWard GTS 64MB的成绩在1024×786下分辨率和32MB几乎一样,当分辨率提高到1280×1024以上时,逐渐拉开了差距。
    ● MDK2 DEMO(表格:MDK2)(^27070201k^)
    MDK2(孤胆枪手)是最近才发表的一款类似于Quake3并且完全支持显卡硬件T&L的OpenGL引擎游戏,在DEMO中提供了硬件T&L开关和FPS测试功能,从测试的情况来看,16位色深模式1024×768分辨率以及32位色深800×600分辨率以下受CPU瓶颈影响GTS和256 DDR的成绩几乎一样,但这两个分辨率以上我们便可以看出GTS明显高于256DDR,性能提升幅度在20%~30%。从7款GTS的测试成绩来看,MDK2是一款精确度不够高(没有小数部分),但测试成绩比较准确的DEMO,7款GTS除了在低分辨率受CPU瓶颈限制有1分的波动外,在高分辨率下成绩完全一样。
    【专业OpenGL性能】
    ● Viewperf6.1.1测试(表格:Viewperf6.1.1)(^27070201q^)
    作为专业的OpenGL测试软件,一共包括5个测试模型:Awadvs 03运行一系列基于有丰富细节的人体模型测试,DRV 06则使用了一个复杂的建模结构。DX 05是一个规模较小的benchmarks测试,实际测试了显卡的剪裁速度。而Light 03则使用一个高达75万个多边形的复杂模型,重点测试T&L引擎的极限速度。ProCRDS运行了一系列测试,基于细节丰富的汽车模型,测试的一方面就是运用反锯齿线条。从测试的情况来看,GTS居然都略输给256 DDR。看来GTS在专业OpenGL方面还有需要完善的地方。而Savage2000的分值异常低,这也反映了Savage2000在专业OpenGL方面的确比较弱。
    ● Indy3D 3.0测试(表格:Indy3D 3.0)(^27070201r^)
    Iny3D也是一个专业OpenGL测试软件:第一个MCAD40测试采用了一个有4万个多边形的引擎,并在此基础上进行一系列测试。第二个MCAD150测试与第一个测试相似,只是采用了15万个多边形的图形引擎。animation测试相对简单,行走的人体只采用了2万多个多边形,而sailing boat航船测试也是一个非常简单的测试,只有7千多个多边形。在所有模型中GTS都超过256DDR,而Savage2000则没有能够顺利通过测试。看来Savage2000的最新驱动程序在专业OpenGL部分bug还不少。前两个模型的测试结果尤其是第二个直接反映了显卡的三角形生成速度,GTS比GeForce256的三角形生成速度快40%,所以我们看到GTS在MCAD40和MCAD150的成绩比Geforce256高出30%~40%。而7款GTS 32MB的测试结果非常接近,绝大多数差异都表现在小数部分,尽管如此大力神GTS还是取得4个中的最高分。同样,64MB的GTS性能略超过32MB版本。
#1    4.硬件T&L一定好吗?(表格:T&L分析)
    自从NVIDIA推出集成硬件T&L引擎的第一代3D芯片GeForce256,硬件T&L就被炒得沸沸扬扬,也一直是广大发烧友津津乐道的焦点,似乎有了硬件T&L支持游戏一定更快。我们特意设计了这组硬件T&L的测试。从测试的情况来看,在低分辨率下整个图形处理系统受CPU瓶颈的限制,这时候通过显卡硬件T&L将T&L部分的工作交给显卡处理,极大地提高了处理效能,这也是我们经常说的“将CPU解放出来”;但当在16位色深1600×1200分辨率甚至1280×1024(MDK2),以及32位色深1280×1024分辨率以上时,由于整个图形处理瓶颈已经转移到显卡上(主要是Geforce2 GTS的显存带宽瓶颈),这时没有使用硬件T&L的测试成绩反而更高(表格中黑体字的数据)。所以我们说在低分辨率低色深模式下硬件T&L的确使CPU得到解放,极大提高3D图形处理性能,但高分辨率高色深模式下,硬件T&L反而进一步加重了显卡的负担,使性能有所下降。(^27070201n^)
#1    5.考察GTS的全屏幕反锯齿 (表格:反锯齿)
    NVIDIA在其5.xx版本的雷管驱动程序中就提供了全屏幕反锯齿FSAA(Full Screen Anti-Aliasing)功能,5.22版驱动程序对FSAA的支持已经比较成熟。NVIDIA的实现方式是在更高的分辨率(原来分辨率的2倍以上)下Rendering画面,然后按照显示分辨率成比例缩小,通过过滤filtering来实现柔化画面边沿锯齿的效果。我们分别在Quake3、MDK2、以及D3D的《极品飞车5》、微软的Motocross Madness 2游戏中检验了FSAA的效果。从测试的画面来看,这种反锯齿的效果的确很不错,锯齿明显减少。但在低分辨率下仍然能够隐约看到锯齿的痕迹。在800×600模式下进行反锯齿后的画面效果比1024×768模式下没有进行反锯齿的画面效果还漂亮。比较遗憾的是,由于报纸印刷的局限性我们这里无法提供效果图。
    另外我们还对反锯齿的性能衰减情况进行了测试。
    在1024×768分辨率下如果使用反锯齿,则每帧要额外处理2MB的像素,如果不采用FSAA时是100FPS,那么要保持这一速度,必须额外消耗2×100=200Mpixel/sec像素填充率,显然这已经消耗了GeForce2GTS总像素填充率的近一半了。所以在FSAA模式下FPS急剧下降一半甚至更多也就不足为奇了。从测试情况来看,在Quake3分辨率640×480×32bit时,反锯齿性能还能够保证80FPS的亮丽成绩,一旦到800×600dpi模式速度就下降了一半只有60FPS,分辨率进一步提高性能更加下降得快。
    NVIDIA对D3D反锯齿提供了多达8种选择,它们分别代表(如下^27070201p^)。我们也做了初步性能测试,性能衰减情况和Quake3非常相似,当FSAA值选择为3×时达到了画质和性能的最好结合点,一旦FSAA达到4×以上性能的衰减更加厉害,当然画质也有进一步的提高,但差别已经非常微小。
#1    6.GTS超频潜力分析
    我们选择了这次测试超频能力最强的丽台GTS进行超频实验。从前面的测试我们已经总结出GTS在高分辨率高色深模式下受显存带宽限制性能较低,所以我们首先进行了显存的超频,从超频情况来看,每提高10MHz,FPS值就几乎提高1帧,当显存频率提高到400(比333的标准频率提高20%),显存带宽由5.2GB/s提高到(400M×16bit)/1024=6.2GB/s(同样提高20%),FPS居然从76.4提高了13帧达到89FPS(提升16.5%,与带宽提升幅度基本保持一致),这里进一步证实了GTS显存带宽问题尚未得到很好解决。而如果对核心频率进行超频,由于GTS核心频率提升幅度远远不及显存,所以我们基本以5MHz为一个台阶,但从测试情况来看,性能提升微乎其微,当核心频率从200提升到240这一几乎极限的频率值时,FPS才从76.4提升了1帧,而GTS的填充率同样从1600Mtexels/sec提升到了240×8=1920Mtexels/sec(提升近20%),所以再一次反映了GTS的瓶颈不在填充率上,而在显存带宽上面。
#1    7.打造你的超级驱动程序
    NVIDIA提供的公版标准驱动程序已经内含如超频选项以及D3D刷新同步开关等非常实用的功能,运行Windows98注册表修改程序REGRDIT.EXE,找到“HKEY_LOCAL_MACHINE\Software\NVIDIA Corporation\Global”子项,在其下添加关键字“NVTweak”,然后在NVTweak中添加一个名叫“Coolbits”的双字节项,并且把“Coolbits”的值设定为3,OK!再打开GTS显卡属性,你会发现在D3D的功能夹中增加了D3D垂直刷新的同步开关,而且更酷的是在显示属性中增加了“Hardware Options”选项,这就是我们的超频选项了,分别提供3D芯片核心频率Core Clock和显存频率Memory Clock的调节滑条,两者的最高频率因各显卡BIOS的情况而有所差异。
#1    8.GTS的Windows2000驱动程序足够完善吗?
    随着微软Windows2000(简称Win2K)操作系统的发表,如今各显卡厂商都提供了Win2K的驱动程序,而且也有不少读者在关注Win2K并准备升级到Win2K操作系统。所以我们也测试了GTS的Win2K驱动程序的运行情况,试用之后的初步印象是:GTS的Win2K驱动程序比较完善,基本上可以在常规应用程序中正常使用。
#1    9.用什么CPU配合GTS更合适?(表格CPU瓶颈分析)
    从以上测试我们的确感受了GTS的超级性能,但有不少用户关心更关心GTS在自己的机器上性能究竟如何,所以我们也进行了包括赛扬、赛扬Ⅱ、Coppermine、Athlon速龙以及新发表的Duron、Tbird各种平台下的测试。
    我们设计了三种主板平台,各平台上除了CPU不同外其余配置都相同(参看图表)。从测试结果来看,上面提到的两种CPU瓶颈表现情况都充分表露无疑,在640×480分辨率下,赛扬333平台上GTS只跑出了53FPS,而在雷鸟850上却跑出了131.9FPS的最高纪录,比前者提高2倍多,当CPU速度从333MHz提升到Coppermine733时,CPU速度提高1倍,FPS速度也提高到115.6,提高1倍。而且我们很容易看到在640×480到1024×768分辨率改变,FPS速度却几乎不变的情况,表格中阴影部分基本上都处于CPU瓶颈状态。从测试结果我们也看到这样一些特点:
    GTS的硬件T&L的确让CPU得到充分解放,尤其有利于低档系统上保持较理想的速度,像我们的赛扬333系统,尽管333MHz的CPU如今已经为游戏迷和发烧友不齿,但GTS仍然能够在绝大多数分辨率下面保持50FPS以上的不错性能;尽管已经把T&L部分的工作交由有强大的处理能力的GTS来完成,仍然使大多数主流的CPU显得不堪重负,CPU瓶颈非常明显,哪怕是我们的Coppermine733、Tbird850测试平台仍然在16位色1024×768分辨率以下以及32位色800×600分辨率以下受到CPU的钳制。(^27070201s^)
#1    结  论
    Geforce2 GTS设计非常成熟,驱动程序完善,在GeForce256的基础上进一步大力提高填充率,成为目前游戏消费市场上填充率最高的3D芯片,但GTS仍然受显存生产工艺的限制没有很好地解决显存带宽瓶颈,尽管如此GTS仍然是目前3D市场最强悍的3D处理芯片。参测的各家GTS显卡,由于采用公版设计,并且驱动程序也基本采用标准版本,性能差异极小,稳定性都很好。