本报评测室对新一代3D显卡的测试报告
随着3D游戏越来越普及,3D加速卡日益受到用户的关注。几年前还名不见经传的3dfx、nVIDIA也成了明星公司。
不知从什么时候开始,3D加速卡开始成为电脑配件中,除了显示器以外最昂贵的部件,而按照目前的标准1200元左右 才是最新主流3D加速卡的底线。由于新产品的推出,旧产品的价格飞快滑落,一张RIVA TNT 8MB SGRAM只要700元左右。(^224901a^)
为了让读者了解新一代3D加速卡的之间的差别,我们从2月份开始策划了这次测试。
#1 它们都是全新产品吗?不,只是加强的改进版本
从厂商的命名上看,这些3D加速卡都升了一代。让我们来看看他们的共同特点:
1)0.25微米工艺;
2)100MHz以上的核心频率;
3)采用更高速的显示缓存,高达166~200MHz的显存;
4)128位3D内核,128位2D核心,128位数据传送接口;
5)300 MHz RAMDAC成为起点;
6)除Voodoo3只支持16MB以外,高阶版本支持高达32MB以上的显示缓存;
7)完整的API支持,DirectX 6.X/7.X、OpenGL ICD,并支持Windows NT/2000、Linux等等;
8)双像素渲染引擎, 单周期同时渲染两个像素和single-pass mulit-texturing;
9)更多的高级3D特效成为标准配置,32位Z缓冲或24位Z缓冲+8位模板缓冲(Stencil Buffer),如Bump map凹凸材质贴图、各向异性过滤Anistropic Filtering、全景反锯齿Full Scene Anti-aliasing,完整的DirectX 6.X的材质混合TextureBlend3D;
10)渲染质量提高,除Voodoo3以外均支持 32位色彩渲染,不少3D加速卡内部已经采用全面的32位运算,在最后输出的时候再转换成16位;
11)视频部分的加强,对DVD 回放的加速等;
12)数位平面输出接口Digital Flat Panel
13)驱动程序针对Intel SSE (KNI)和AMD 3Dnow!优化。
看起来真的好像是全新的一代,可仔细看看你会发现这些特征前一代都有了。Voodoo3 可以看成Voodoo Banshee 加 入了第二贴图单元, RIVA TNT2 则是TNT 的加强版本,当然在很多3D处理细节上,这些产品也有改进。
而速度大幅度提高的主要原因,是制造工艺的提高使得核心频率大幅度提升。目前大多数3D加速芯片都采用了0.25微米生产工艺,而前一代大多数是采用0.35微米。就好比是200MHz Pentium和100MHz Pentium比速度一样, 芯片的运算能 力大大提高。
而采用更高速的显示内存是第二个原因,目前最高级的3D加速卡采用了183MHz或200MHz的显示内存,比起目前系统内 存的100MHz/133MHz,速度提升接近一倍。
#1 我需要那么快吗?
·我需要用多少钱去买一块3D加速卡,让大部分现有的3D游戏更流畅?
·Voodoo3/TNT2好是好,但价格太贵,我需要那么快吗?
这两个问题可能是很多人在问自己的问题。而在3D芯片设计厂商中,二者的观念也有争执。Intel i752、dent Blade3D的设计理念是:够用、够便宜,适合目前大部分游戏,而3dfx、nVIDIA 则追求顶级速度。
对于狂热的3D发烧友,则是快还要再快,对速度的渴求没有上限,越快越好。
3dfx更是提出了3D游戏要达到60FPS(每秒帧数)新指标。从我们玩3D游戏的感受来看60FPS的确能让游戏更爽利。但在目前的顶级配置下,打开全部效果,一些新游戏在1024×768×32Bit模式下只有一二十帧,连30帧的基本要求都无法达到,比如即将推出的Quake 3。
从目前的趋势看来,800×600×16Bit/32bit将成为大多数3D游戏的标准,而目前大多数3D游戏只要求640×480×16Bit。如果你只想玩目前的3D游戏,不追求高分辨率,一张3dfx Voodoo2绝对足够。而对于想用1024×768×32Bit以上分辨率来玩游戏的狂热玩家,目前最高等级的3D加速卡可能勉强够用。
#1 决定3D加速卡快慢的关键,CPU和现有体系已经成为瓶颈
除开厂商的不同芯片设计,芯片的核心频率和采用的显示内存的速率成了决定加速卡快慢的关键。厂商也根据芯 片的频率,把芯片分成不同的版本。制造工艺的提高,芯片的极限运行频率也大大提高。以进度最快的3dfx、nVIDIA来看,核心频率高达175MHz以上,显示内存的速率也达到183MHz(5.5ns)/200MHz(5ns),目前的超频记录是Herculesbr的TNT2达到了200MHz(核心)/240MHz(显存)(^224901b^)
高频率运行必然会带来大量的热量,目前无论是Voodoo3还是RIVA TNT2都带有大大的散热片。测试实验室的流行观念:看3D加速卡快不快不测也知道,没有带散热片的肯定不会快。
由于目前DirectX的3D处理过程中,CPU仍然负担相当大的运算工作,如3D几何计算。AMD的3DNow!,Intel的SSE(KNI)都是加速该过程的有效方法。
#1 AGP之争
目前Intel已经提出AGP 4×的标准,从CPU到显示卡之间的峰值带宽为1GB。
nVIDIA RIVA TNT2/Vanta、S3 Savage4、MGA G400均支持AGP2×/4×标准。高阶显示卡的内存运行于接近 200MHz,加上128位的数据接口,带宽高达3.2GB/s,而对比系统内存100MHz 64位接口的800MB/s。显示要比3D芯片从系统内存中直接取数据快好几倍。(^224901c^ 通用AGP2×/4×插脚)
如果采用1024×768×32Bit 以上分辨率, 3D资料的传送也是非常大的负担。系统内存的带宽明显成为瓶颈。
因此AGP材质在新一代加速卡已经不是重点,大多数3D加速卡,更热衷于加大显存,提高可以容纳的材质大小,提高显存频率。提高显存大小带来的另一个好处,是可以支持更高的2D/3D分辨率。对于Voodoo3的用户来说,不支持AGP材质虽然遗憾,但它不是关键。
下一代的AGP 4×采用1.5V,和现在的AGP2×/3.3V插脚也不兼容,但部分厂商,如nVIDIA已经开发出AGP2×/4×通用模式,并且可以根据接口类型,自动决定电压(见^224901d^ AGP4×1.5V插脚,^224901e^ AGP2×/3.3V插脚)。
#1 都是TNT2、Savage4,差不多吗?
从这一代3D加速卡开始,厂商已经根据频率来制定芯片的版本,而RIVA TNT2,S3 Savage4只是一系列加速卡的总名称。不同显卡生产厂家会根据采用的材料、工艺、不同显存,散热、稳定情况制定实际产品的核心频率和显存频率,因此同种芯片不同厂家的产品性能会有很大的差异,读者在选购是要注意。
#1 下一代3D加速卡
为解决目前3D加速卡的瓶颈,下一代3D加速卡将支持几何运算加速,使CPU解放出来,在较慢的CPU上也能达到理想的速度,这将是最重要的进步。其他比如将支持单周期4像素渲染引擎,支持更多的显示内存(高达64MB),更快的32位色彩渲染速度,更高的频率,更高的显示内存频率,完全的AGP4×的支持。
聪明的读者可以看到3D加速卡和CPU非常类似,可以预见在CPU采用的一些高级技术也将逐渐应用到3D加速卡上来。目前3D加速卡上已经和CPU一样采用速度分级,说不定哪天会出现Voodoo4/300,TNT3/350这样的显卡命名法,也有可能出现可以升级的3D加速卡,就像现在CPU升级一样方便。
#1 DirectX 7.0
配合下一代3D加速卡,DirectX 7.0将加入对硬件几何运算加速支持,已经支持硬件3D转换transform和光源 lighting运算的支持,另一个重要的功能是支持DirectX扩展,厂商可以根据自己的需要,加入一些新的功能以最大限度的发挥硬件作用。不过这两点OpenGL都已经支持。据说DirectX 8.0还将增加场景管理功能。
目前nVIDIA 已经宣布下一代产品,代号为NV10 的3D芯片将支持硬件3D转换transform和光源lighting运算,其整体性能据称为目前RIVA TNT2(代号NV5)的4~5倍,将于今年底推出。
#1 整合主板的威胁
目前Intel推出了内部集成i752的i810整合芯片,VIA也推出集成Trident Blade3D的MVP4,i810集成3D加速卡的性能和400~500元左右的3D加速卡相比毫不逊色,基本可以满足目前的普通3D游戏的需求,可以预见低端的3D加速卡 市场,将逐渐被整合主板替代。
3D芯片厂商也意识到这一问题,如nVIDIA VANTA,S3 Savage4 GT/LT都是这样的产品,一方面该芯片的性能/价格不会影响到TNT2这样的高阶产品,一方面性能比整合主板的3D加速卡性能好。根据我们的测试VANTA比i810集成的i752要强很多。
#1 SDRAM VS SGRAM旧话题
在很多才接触3D加速卡的读者中有很多人有一种SGRAM优越论,认为采用SGRAM版本的显示卡一定比SDRAM好,而且还有很多错误观念,如:
1.SGRAM具备128位数据传送接口,SDRAM只具备 64位;
2.只有SGRAM才能发挥128位3D加速卡的全部能力;
3.采用SGRAM的才是高档卡;
4.采用SGRAM的版本比SDRAM版本颜色更鲜艳,视觉效果更好。
这些观念基本都是错误的,要根据3D显示卡实际的情况去判断,3D芯片是否对SGRAM进行了优化等等。目前Creative Savage4和ELSA的TNT2都采用了4颗8MB(2Mx32)的高速SDRAM构成128位数据传送接口,反而成本较高。