笑傲江湖 Nvidia GeForce3全面测试

Author: 电脑报评测实验室 Date: 2001年 13期

    NVIDIA开发代号为NV20的全新3D处理芯片,终于在2月底与我们见面了,这次NVIDIA在3D图形处理芯片界领跑者的姿态更加明显,几乎没有给对手留下喘息的机会,一副独孤求败的样子。
      NV20的规格在网上公布已经有近半年时间,令众多发烧友期待已久。这次以GeForce3的正式名称在INF2001上现身,给整个3D市场带来极大震撼。我们也迫不及待希望了解其性能,电脑报评测实验室在国内媒体中率先拿到GeForce3样品,并为此做了近两周的周密测试,为大家奉献这篇过足瘾的测试报告。
  #1    一、GeForce3顶级3D加速卡
  #2    1.新一代3D处理芯片──GeForce3
      从规格比较表(表1)(^13080201d^)我们可以清楚地看到,GeForce3的核心频率只有200MHz,与GeForce2/Pro相同,不及GeForce2 Ultra的250MHz,填充率相应地受影响,而显存基准频率为230MHz(460MHz DDR),显存带宽和GeForce2 Ultra完全一样。这些理论指标似乎并没有看出GeForce3有什么新意,但采用0.15微米工艺制造的GeForce3,集成的晶体管数量却是GeForce2 GTS系列芯片的两倍,甚至远远高出Pentium4的4200万。如此多的晶体管集成度,我们可以想象其强悍的效能,这些多出的晶体管就是GeForce3在GeForce2基础上做全新结构设计的产物。(^13080201a^)
      GeForce3和GeForce2一样有4个渲染管线,每个管线可以实现双纹理贴图,不过在处理方式上更先进,克服了GeForce2各渲染管线必须独立运作的传统方式,GeForce2需要2个时钟周期才能够完成的4纹理像素,GeForce3只需要1个时钟周期,而4纹理像素正在被新一代3D游戏广泛使用;GeForce3对GPU做了更彻底的改进,使“nfiniteFX”引擎真正可以完全编程,“nfiniteFX”引擎的顶点描绘单元(Vertex Shader)可以在不牺牲效能的情况下实现以前所不能够完成的动态角色(Character Animation)、环境效果(Environmental Effects)、程序变形效果(Procdural Deformation)。而“nfiniteFX”引擎的像素描绘单元(Pixel Shader)则除了实现G400、Radeon中才能够实现的环境凹凸映射Environmental bump mapping(EMBM)外,还可以实现一些以前无法实现的NVIDIA独创特效,如阴影贴图、等向BRDF照明、真实反射凹凸贴图等。除此之外,GeForce3还对显存架构进行了突破性的改进,NVIDIA这种所谓的“光速显存架构”以独特的显存交错控制技术、无损Z压缩算法以及Z封闭选除技术,使得显存带宽利用效率显著提高,也消除了浪费在获取数据和清除Z缓冲数据上的显存带宽,这种显存带宽上的技术改进已经超越ATI Radeon的硬件Hyper Z电路技术,也是GeForce3作出的非常有现实意义的3D技术突破。最后我们还得提一下GeForce3采用的HRAA高分辨率反锯齿技术,这种NVIDIA特有的Quincunx五点梅花采样所消耗的帧缓存带宽,和传统的2X FSAA全屏幕反锯齿相当,但反锯齿效果更好。
      总之,GeForce3更完善的渲染管线,可编程的顶点描绘单元、像素描绘单元,光速显存架构和全新设计的HRAA高分辨率反锯齿技术都使得GeForce3可以在填充率、显存带宽不进行突破性提高的情况下实现更加华丽流畅的3D性能。上面提到的各种3D技术可以参阅《电脑报》2001年第10期C1版《再现3D神话》一文。
  #2    2.测试样卡──技嘉Gigabyte GV-GF3000DF
      为了向《电脑报》的读者展示GeForce3的强悍性能,我们从技嘉公司拿到了国内第一片GeForce3工程样卡,这张GeForce3工程样卡其实已经非常接近市售版本,只是处理芯片版本为A4测试版本,显存频率也只设定在400MHz。
      从外观我们会发现GeForce3显卡的PCB大小以及布局都颇有几分像公版的GeForce2 Ultra,只是VGA输出接口调整到了上端,而GeForce2系列卡都在下端。这款GeForce3样卡做工非常精美,完全按照NVIDIA公版设计的,蓝色PCB板非常漂亮,用料也非常好,单面8颗粒装的64 MB DDR SDRAM,显存颗粒为EliteMT的3.8 ns芯片,也就是说速度最高可以到达263 (526)MHz,不过比较奇怪的是技嘉居然把3.8 ns的显存只设定在200MHz(400MHz DDR),显存模块上也没有安装散热片。这款GeForce3具备了全套的附加功能,包括TV电视信号输出(安装在外插板卡上)和DVI接口。为了真实反映GeForce3标准版本的性能,我们在测试中将显存提高到了230MHz来测试。(^13080201b^)
  #1    二、性能测试
      测试平台:
      Intel PentiumⅢ 1000MHz(133MHz外频)
      Abit SA6 815EP主板
      256MB PC133 SDRSM(CAS=2)
      IBM 75GXP ATA100 7200RPM 15GB硬盘
      SONY 52X CD-ROM
      LG 795FT plus显示器
      Intel 10/100M PCI网卡
      Windows98SE+Microsoft DirectX8.0A
      Windows2000 Perfessional+DirectX8.0A
      Windows显示分辨率设定为1024×768@32位色,关闭D3D和OpenGL的屏幕刷新同步,除了反锯齿测试外,其他测试都是在关闭反锯齿的情况下测试的。我们特意从耕宇公司借到GeForce2 Ultra 64M DDR显卡与GeForce3作对比测试。(^13080201c^)
      ●2D测试
      350 MHz RAMDAC使得GeForce3支持的最大分辨率达到2048×1536@32bit,这恐怕只有21英寸高档大屏幕显示器才能够支持到如此高的分辨率,而且GeForce3可以在2048×1536@32位色深模式下达到75Hz的屏幕刷新率,在1280×1024@32位色深下已经达到150Hz的刷新率,只要你的显示器带宽足够高,完全可以得到非常稳定毫无闪烁的显示画面。不管是2D显示质量还是2D性能,GeForce3与GeForce2系列并没有什么区别,Winbench99商用图形和高端图形性能基本上都在438、1170左右,而且显示相当清晰锐利,不过从与MatroxG400 MAX的对比来看,GeForce3还算不上2D表现最出色的显卡。
      ●D3D性能测试──3D Mark2001(表2)(^13080201e^)
      3D Mark2000已经成为业界公认的D3D游戏性能测试软件,针对新一代显卡的各种特性,MadOnion公司两周前发表了全新版本──3D Mark2001,正好赶上我们这次测试,也算是目前唯一能够真正展示GeForce3性能的D3D测试软件。3D Mark2001把游戏Demo增加到4个,而且支持DirectX8所有的特性,包括Vertex Shaders、Pixel Shaders、Point Sprites、DOT3 bump mapping等。可编程顶点描绘单元已经在前三个游戏Demo(Rally、Dragon、Lobby)中被使用,而第四个游戏Demo则真正展示了像素描绘单元能够产生的近乎真实的绚丽效果。第四个游戏甚至因为Radeon和GeForce2显卡缺乏相应的硬件特效支持而无法运行,所以总成绩3DMark对其他卡多少有些不公平,但我们可以对各子项进行分析。
      从填充率的测试来看,16位色深模式下GeForce2 Ultra的单材质填充率达到710多,高出GeForce3,但与其峰值1000Mtexels/s相比还是只发挥出70%的效能,而峰值只有800Mtexels/s的GeForce3却发挥出85%以上的效能,而且在多材质情况下,GeForce2 Ultra更只发挥出50%的效能,而GeForce3则达到1400左右,远远高出GeForce2 Ultra,并且已经非常接近1600的峰值极限,发挥出了90%的填充率效能。从4个游戏Demo的测试来看,Game4只有GeForce3才支持,而且这4个游戏Demo由于使用了大量全新3D特效,使得GeForce3在高细节模式下性能都只能够达到30~40帧。而且像GeForce2 Ultra这样高端的3D卡,所有3DMark成绩都在4000以下,而GeForce3在1024×768@16bit模式下突破5000,在16位色深各分辨率下GeForce3的性能高出GeForce2 Ultra 30%以上。在32位色深情况下,GeForce2 Ultra性能衰减非常厉害,在1024×768、1280×1024、1600×1200 3个分辨率下性能衰减分别达到8%、17%、26%,而GeForce3在前两个分辨率下只有3%、7%的性能衰减,即使在1600×1200最高分辨率下也只有12%的性能衰减。
      ●OpenGL性能测试──100fps级的顶级3D卡
  #2    1.Quake3、MDK2(表3)
      作为多材质运用的典型,Quake3至今仍然是测试显卡OpenGL游戏性能最理想的测试软件。Quake3对图形加速卡像素填充率的依赖性较大,所以我们看到在16位色深模式下, GeForce2 Ultra以更高的填充率取得更高的FPS成绩,GeForce3落后几帧,但32位色深各分辨率下,GeForce2 Ultra受显存带宽瓶颈的限制,性能一下子衰减了40%左右,GeForce3才真正显示出其显存优化带来的优势,与16位色深各分辨率相比性能几乎没有衰减,性能异常耀眼,能够在1600×1200@32位色深模式下跑出74.5帧的速度的确是我们第一次见识。(^13080201f^)
      而且除1600×1200分辨率外其余各分辨率的速度都在100fps以上,我们不得不称GeForce3为百帧级别的3D怪兽卡。MDK2的测试情况和Quake3基本相似,同时我们也可以发现,GeForce3工程样卡的显存频率为400MHz,显存带宽比显存频率为466MHz的标准版低,几乎所有分辨率下的速度都比标准版低几帧,而且越是高色深高分辨率,性能受影响越明显。
  #2    2.Vulpin GLMark v1.1(表3)
      Vulpin GLMark是Vulpin公司最近才发表的OpenGL性能benchmark测试软件,是专门针对新一代3D加速卡的特点设计的,完整地包括了OpenGL速度和画面品质测试,所使用的3D引擎在即将上市的新一代游戏中将被广泛使用,并充分运用了新一代3D加速卡的各种3D特效,包括OpenGL标准的最新扩展,像纹理描绘(Texture Shade)和顶点编程(Vertex Programs)等。在测试过程中你会发现整个测试画面非常华丽,细节异常丰富,而且也真正检验出GeForce3和GeForce2在画质上的差异,GeForce3渲染的水面是蔚蓝色的,而GeForce2却发黑。从平均速度fps成绩来看,GeForce3的性能优势的确明显。除了800×600@16bit模式GeForce3和GeForce2 Ultra没有拉开距离,保持在70fps外,其余的各分辨率尤其是32位色深下的所有分辨率,GeForce3全面领先,在高分辨率下,优势更明显。在1600×1200@32色深分辨率下,性能超出GeForce2 Ultra高达60%。而且我们也进一步看出,GeForce2 Ultra在32位色深各分辨率下,性能衰减非常厉害,尤其是高分辨率下,而GeForce3在32位色深各分辨率模式下完全可以保持性能基本没有衰减。
  #2    3.专业OpenGL性能──Viewperf、Indy3D(表4)
      Viewperf、Indy3D都是基于图形工作站的高端3D动画测试,前面几个复杂的测试项目Geforce3表现都不太理想,这一方面和GeForce3的填充率比GeForce2 Ultra略低有关系,而更重要的是驱动程序的不完善,包括对OpenGL扩展的支持上还需要改进,毕竟所使用的雷管3 10.08版驱动程序只是第一个直接支持GeForce3的驱动程序版本,随着驱动程序的逐步完善,尤其是NVIDIA正在与3DStudio MAX的设计公司Discreet密切合作,打造GeForce3的优化版本,届时,相信GeForce3的专业OpenGL性能应该有更完美的表现。(^13080201g^)
  #1    三、引领潮流的全屏幕反锯齿(表5)
      在nVIDIA雷管10.08版本驱动程序中,与以前版本将D3D和OpenGL的反锯齿分别设置不同的是,NVIDIA已经将D3D和OpenGL的反锯齿统一成一个选项,提供了2× FSAA、Quincunx AA和4X FSAA三种反锯齿模式选项,其中Quincunx是GeForce3特有的,而当我们安装的是GeForce2 Ultra时就只有2× FSAA、4×FSAA两个反锯齿模式选项了。从测试结果看来,过去显卡在反锯齿情况下性能急剧衰减的情况,在GeForce3上得到极大改善,GeForce3的2X FSAA 和Quincunx反锯齿,除了High Quality模式高于1280×1024分辨率时低于60fps外,其余各分辨率都在60fps以上,已经非常流畅,而GeForce2 Ultra在Normal模式关闭反锯齿时还领先GeForce3,一旦加上反锯齿,性能一下子衰减下去,远远低于GeForce3的速度,我们可以发现GeForce3采用4×FSAA反锯齿的速度都可以达到GeForce2 Ultra采用2× FSAA反锯齿的速度。而且从反锯齿画面质量来看,GeForce3专有的Quincunx AA的确比2× FSAA的反锯齿效果更好。(^13080201h^)
      从D3D的反锯齿测试3DMark2001也可以发现,GeForce3的2×和Quincunx反锯齿已经非常具有实用价值,除了Game4外,其余3个Game的2×和Quincunx反锯齿成绩都与关闭反锯齿后的成绩非常接近,不过一旦采用4×反锯齿,性能衰减还是非常厉害。
  #1    四、超频性能(表6)
      尽管从实际应用的角度来看,像GeForce3这样强劲的顶级3D加速卡再超频已经没有太大必要,但为了检测提高核心频率和显存频率对GeForce3的性能提升是否有影响以及影响的程度,我们还是有必要进行超频性能的测试,更何况技嘉这张GeForce3工程样卡提升显存频率的空间非常大。我们分别对GeForce3核心和显存进行了超频测试。200MHz的GeForce3核心超频空间并不大,可以比较稳定地超到220MHz,最高可以超到225MHz,但已经非常不稳定,超频后性能只提升了2到4帧,分辨率越高性能提升的帧数越多,但性能提升的幅度与核心频率提升的幅度并不成正比,将200MHz核心超到220MHz,频率提升了10%,但性能只提升了3%。而460MHz的显存频率可以比较大幅度地提升,基本上可以超到3.8纳秒显存的理论额定频率526MHz,但实际上超到515MHz的时候屏幕已经开始花屏,超到529MHz的时候则完全惨不忍睹。看来显存要达到如此高的频率不仅是对显存额定频率的考验,实际上更重要的是对显卡布线设计的考验,如何在这样高的频率下保证信号稳定,减少干扰就看显卡设计厂家的功力了。从测试也可以看出单独超显存,性能提升幅度非常小,将460MHz显存提升到515MHz后,低分辨率下性能只提升了一两帧,1280×1024以上各分辨率才提升了四五帧,性能提升的幅度同样和显存提升幅度不成正比,看来GeForce3的确已经极大改善了GeForce256、GeForce2 GTS上出现的显存瓶颈问题,核心和显存带宽的配合已经比较协调。所以我们同时对核心和显存进行超频后(超到220/500MHz),你会看到性能的提升已经比较明显,在Quake3 HighQuality模式1280×1024下性能从104FPS一下子提高到112.1FPS,提高了8帧,不过在1024×768以下各分辨率性能提升仍然不明显,这应该和CPU处理瓶颈的限制有关系。(^13080201i^)
  #1    五、Win2000下驱动程序完善程度及性能测试
      如今Windows2000以其良好的稳定性和安全性已经被越来越多的用户所接受,我们对GeForce3在Windows2000下的表现也进行了测试,雷管10.08版Windows2000的驱动程序安装非常顺利,而且Win98驱动程序所具有的各种选项,Windows2000驱动程序同样具备,整个测试过程没有发现任何不稳定或者出错情况,从性能表现来看,一致性并不太好,除少数测试项目与Windows98表现相同或者轻微超出外,大多数测试成绩都比Windows98低,尤其是3DMark2001和专业OpenGL的测试,看来10.80版Windows2000驱动程序还是有待进一步完善,相信随着驱动程序的进一步完善,GeForce3在Windows2000下的表现应该更出色。(^13080201j^)
  #1    六、不同平台下的性能表现
      对于如此怪兽级的3D加速卡,要什么样的CPU搭配才合适呢,如果你打算购买GeForce3将不得不关心这一点,我们将GeForce3分别在Intel和AMD的多款CPU平台下做了测试,从测试结果可以很明显地看出CPU速度的差异对GeForce3性能发挥的影响程度,除了1600×1200分辨率外其他各分辨率下,只要CPU速度越高GeForce3发挥出的FPS速度就越快,而且分辨率越低GeForce3的性能受CPU速度的影响越大,在Quake3 Demo001 Normal800×600分辨率下,如果是1GHz PentiumⅢ平台,可以跑出140.9FPS的成绩,而如果是PentimⅢ 550MHz则只能够跑出90.1FPS的速度,速度损失达50FPS,将近一半,而且从各大网站的测试看得出,即使是1GHz的CPU,在低分辨率(1024×768分辨率以下)仍然没有完全释放出GeForce3的性能,所以根据目前的实际情况,要使GeForce3的性能得到比较好的发挥,至少你需要购买866MHz以上的CPU,如果有条件,CPU速度越快越好。
  #1    七、测试结论
      ●GeForce3──一款32位性能出众,各方面均衡的顶级3D加速卡
      在GeForce3之前,有ATI的Radeon比较好地解决了32位色高分辨率性能衰减的问题,而GeForce3在32位色的表现更是耀眼,几乎没有性能损失,而且GeForce3算是一款各方面都平衡得恰到好处的3D图形加速卡,GPU和显存带宽协调配合,没有出现明显的瓶颈。
      ●GeForce3令反锯齿真正走向实用
      GeForce3一改过去3D显卡在反锯齿模式下性能急剧衰减的状况,在1024×768×32的分辨率下也可以实现2×全屏幕反锯齿和Quincunx反锯齿60FPS以上的流畅速度,使得反锯齿真正成为新一代显卡完全可以实用的技术,用户在享受完美的3D效果的同时不必承受性能上的重大损失。
      ●对微软DirectX 8.0的完全支持为用户带来更华丽的画面,为程序员编程带来极大方便
      GeForce3的完全可编程“nfiniteFX”引擎使得程序员进行游戏设计时更加方便灵活,可以在他们设计的游戏中添加进一些非常有趣的效果,可以更加自由地运用T&L机构,为用户在娱乐的时候带来更精致的画面。
      ●GeForce3芯片和驱动程序正在完善
      虽然现在各大显卡厂商纷纷发布基于GeForce3芯片的显卡,但是目前已经证实编号为A3、A4的几款GeForce3公版测试出现了和Intel支持Pentium 4处理器的850芯片组之间的不兼容现象,另外有些厂商表示,由于某些BUG的存在,GeForce3甚至根本无法完成动态测试。目前已确定华硕、ELSA、丽台以及微星等显卡厂商在进行基于Pentium 4主板的测试时都已经出现了兼容性问题。而且从我们这次测试也发现驱动程序的一些问题,尤其是专业OpenGL性能的不理想,看来GeForce3芯片和驱动程序都尚待完善。据可靠消息Nvidia除BUG的工作已经基本完成,估计正式出货时间应该在4月中旬,届时GeForce3芯片的编号应该为A5,而驱动程序方面则会是一个不断完善的过程,在你读到这篇文章时,Nvidia的雷管11.01版驱动程序已经发表,相信随后发布的新版驱动程序会使GeForce3表现出更加靓丽的性能。
  #1    八、后记
  #2    1. 1024×786×32bit正在成为未来游戏标准
      随着GeForce3的推出,享受32位色绚丽的游戏画面成为现实,像Quake3、MDK2这样的游戏,GeForce3即使在32位色1024×786分辨率下也可以轻松跑到100多帧,即使是采用最新3D特效的GLMark这样的新一代游戏场景,GeForce3也可以跑出人眼视觉感受能力极限的60FPS,看来GeForce3正在将1024×786×32bit变成未来游戏标准频率,而且3DMark2001的缺省设置中已经将缺省标准频率设定为1024×786×32bit。
  #2    2. 3D性能测试绝代双骄──3DMark2001、VulPine GLMark
      从我们这次所使用的测试软件来看,曾经独霸OpenGL测试软件第一把交椅的Quake3已经被GeForce3完全征服,VulPine GLMark由于采用更多的特效,并为GeForce3充分优化,它将有机会取代Quake 3在OpenGL的测试地位,而在D3D测试方面,3DMark2001的推出正好为新一代3D加速卡提供了最完美的测试软件,我们欣喜地称VulPine GLMark和3DMark2001为3D性能测试的绝代双骄。
  #2    3.价格才是GeForce3和用户之间的桥梁
      GeForce3的确是目前最顶级的3D加速卡,据称4月份上市后其价格会在500到600美金之间,也就是5000多元人民币,这对于国内众多的玩家来说显得可望而不可及,而与其规格类似的GeForce2 Ultra 64M DDR,目前却只要4000元左右(耕晟的甚至只要3500元)。不过随着GeForce3芯片在台积电量产,新产品过了一两个月的市场炒作期后价格应该会降到4000元的水平,相信到时候价格这个GeForce3和用户之间的桥梁才算真正架起。