Radeon 9700不是挑战者
硬件周刊
几个月来,显示芯片市场不断地升温,尽管已经有了Trident XP4、3Dlabs P10和Matrox Parhelia-512这些先行者,但是至今仍没有谁敢声称完全支持DirectX 9。以往一贯处于挑战地位的ATi终于在7月17日首先推出了新一代产品──Radeon 9700(如(图1)),出人意料的是,这次新品发布会不是在ATi的“老家”多伦多,而是跑到了NVIDIA的门口──加利福尼亚的旧金山,颇有挑衅的意味。

难以想象的规格
Radeon 9700芯片的开发代号是R300,当然属于第三代的“镭”系列。这块芯片不论谁看到都会留下深刻印象:典型的FC-BGA封装,样子很像PentiumⅢ或者AthlonXP,芯片大小和Willamette的P4差不多,也只有这样的封装才能具有足够的散热潜力;不过翻过来就不像了,近千个引脚的惊人外观至少是前所未见的,这已经超过AMD尚未推出ClawHammer处理器。当然这样“壮观”的封装成本也是创纪录的。
Radeon 9700的内部结构也让我们叹为观止:0.15微米的工艺,1.1亿个CMOS管构成的核心,这又创造了ASIC(特定用途集成电路)规模的纪录。
Radeon 9700目前的样卡核心工作频率是325MHz,ATi能够保证最终产品运行在300MHz,并希望能够提升到325 MHz以上。Radeon 9700使用的内存是256位的DDR显示内存,尽管使用的是标记为2A的2.8ns三星显存,但也暂时只能跑到620MHz,内存带宽为256bit/8×2×310MHz=19,840MB/s。Radeon 9700采用AGP 8×总线,总线带宽比AGP 4×足足提高了一倍,且不说2.1GB/s的带宽在近期内是否实用,但考虑到未来的升级潜力还是需要的。
真正的DX9体系
Radeon 9700的结构还是比较传统的,我们仍旧能够从架构框图中找到T&L(硬件转换和光源处理)部分和渲染部分。组成SmartShader 2.0的是2.0版Vertex Shader(顶点着色引擎)和2.0版Pixel Shader(像素着色引擎),按照DirectX9(以下简称DX9)的要求,3D芯片应当从头到尾都是浮点结构,以保证图形处理的精度──这就是为什么Radeon 9700需要如此庞大结构的主要原因。
Radeon9700的T&L部分就是4个并行的可编程顶点着色引擎,对比GeForce 4 Ti系列的双Vertex Shader,处理能力提升了一倍。Radeon 9700全新设计的三角形设置引擎加上强大的核心频率,达到了每秒生成3.25亿三角形的新纪录,足足有GeForce 4 Ti4600的1.36亿三角形/秒的两倍多。
Radeon 9700的渲染部分是8条像素流水线,每条流水线具有1个纹理贴图单元。在300MHz的核心频率下的像素填充率相当于GeForce 4 Ti4600的两倍。这8条都是128位的浮点像素流水线,其浮点运算精度与GeForce 4 Ti和Radeon 8500的64位整数精度不可同日而语,这对于色彩、特别是光影效果特别重要。在色彩输出方面,Radeon 9700沿用每个色彩通道10位的RAMDAC,而非真正的128位格式。
改良的技术
Radeon 9700采用了HyperZ Ⅲ技术,除了提高时钟频率外,ATi还为HyperZ Ⅲ增加了Early Z这个新的功能。HyperZ Ⅲ包括四个部分:Hieraachical Z负责判断所有像素在Z轴(距离远近)上的排列顺序,去除那些被遮挡掉的部分,减少不必要的渲染工作;在这个工作中,Early Z将Z轴数据细分到像素水平,从而提高不可见像素的去除效率,ATi声称目前已经达到了接近100%的水平;Z-Compression就是压缩Z轴坐标数据,减少对位于显示内存中的Z-buffer的读写数据量,降低对显存带宽的依赖;Fast Z-Clear能够对Z-buffer快速清零,这在每次场景切换时特别有用。
FSAA(全景反锯齿)对于很少有人注意到两种FSAA模式的异同:SuperSampling(超级取样)是多次渲染略有偏移的场景,最后叠加在一起,尽管反锯齿质量较好,但是渲染的工作量较大;MultiSampling(多重取样)则将每个像素的色彩同其前后像素的色彩混合来消除锯齿,好处是速度较快,但是需要更高的FSAA级别才能达到SuperSampling的效果。这次ATi在Radeon 9700上同时支持超级取样和多重取样(Radeon8500上只采用了超级取样),还增加了专门的硬件FSAA单元──SmoothVision 2.0来提升速度,支持2×/4×/6×的反锯齿模式。
VideoShader、FullStream和RenderMonkey
ATi一向在视频领域傲视群雄,这一次也有新东西──Videoshader。VideoShader不看也知道是符合了如今的“Shader潮流”(就像四处横行的“XP流感”一样),但是有谁猜到了它的内在含义?原来Radeon 9700使用可编程的Pixel Shader加快视频流的处理,改善视频回放的效果,再也用不着外加视频处理芯片了。
一看FullStream就知道它同流媒体有关系。也许是如今的流媒体由于网络带宽限制,质量都不怎么样,ATi才有了这么个减少图像马赛克的灵感。从演示图片看 “去方块”效果还是不错的,虽然分辨率并没有明显的提高,但至少有3D反锯齿那样的平滑感觉。
针对NVIDIA的Shader语言编译器Cg,ATi推出了RenderMonkey(渲染猴子)。幽默的名称背后是一套强大的软件,能够将各种高级编程语言程序编译为R300格式的汇编代码,例如将电影工业最常用的RenderMan指令变换成R300能够直接运行的Shader指令──这才是游戏图像电影化的开端。
平实的Radeon 9000
Radeon 9000比Radeon 9700推出得要早,但Radeon 9000实际上是个改良版的产品,原型是Radeon 8500,但不幸的是它只是Radeon 8500的Cost Down(成本降低)版,引脚兼容于Radeon 7500。
最大的不同点是Radeon 9000的每条像素流水线都比Radeon 8500减少了一个纹理贴图单元,这大大降低了Radeon 9000的性能。Radeon 9000唯一的进步是增加了上述的FullStream功能,因此视频效果有了较大的提升。Radeon 9000又分成Radeon 9000和Radeon 9000 Pro两款:Radeon 9000的核心/显存频率为250/400MHz,远低于Radeon 8500的275/550MHz,售价也较低;Radeon 9000 Pro的核心/显存频率为275/550MHz,正好同Radeon 8500一样,但预计售价为149美元。Radeon 9000系列降低了性能的同时,售价并不比Radeon 8500系列更低──这就令人费解了,看来ATi必须要好好整理整理其价格体系才对。
结 语
Radeon 9700显示卡将在8月上市,预计售价399美元。Radeon 9700真正的对手应该是NVIDIA的NV30。
几乎所有人都相信Radeon 9700将有一款0.13微米的新版本,很可能Radeon 10000这个划时代的名称就是为它预留的,它的发布时间将同NV30近似,也很可能将使用Radeon 9700能够支持、却无缘采用的DDR Ⅱ显示内存(等效工作速度将是同频率DDR的两倍),0.13微米+DDR Ⅱ似乎足以用来对付NV35了吧?
ATi在Radeon 9700和Radeon 9000之间还需要一款中档产品,因此低频率版的Radeon 9700就变得十分必要,这很可能就是Radeon 9500,预计售价为199美元左右。如果属实,Radeon 9500将成为像Radeon 8500LE那样的中流砥柱。