阿天视线(15):NV40先发制人

硬件周刊

  由于NV30不敌ATi的R300系列显示芯片,NVIDIA失去了性能之王的桂冠,所以这一次NV40的发布对于两家巨头而言都具有重要的意义。NV40比R420的发布要早一周的时间,而这次,我们明显地感觉到了NVIDIA来势汹汹,志在必得。

  当地时间4月14日,NVIDIA正式发布了最新最高端的GeForce 6系列显卡──GeForce 6800标准版和Ultra版(核心代号NV40)。NVIDIA方面表示,GeForce 6系列显卡具备众多新特性,其中包括更高速的架构、能够适应最新的软件、具备高精度编码解码芯片以及直接输出HDTV等功能。

  规格提升较高

  在规格方面,GeForce 6800 Ultra内建16条渲染管线,采用256MB GDDR3显存。而标准版GeForce 6800则只内建12条渲染管线,显存方面只有128MB,采用的也是普通的DDR1显存。

  NV40将NVIDIA特有的CineFX技术提升到了3.0版本,支持Pixel Shader 3.0, Vertex Shader 3.0、实时位移映射和Tone映射,最多支持16纹理/通道,支持16bit和32bit FP格式、sRGB纹理,支持DirectX和S3TC压缩、支持32bpp, 64bpp和128bpp渲染以及更多的新视觉效果。

  在特色技术方面,NV40加入了HPDR(High-Precision Dynamic-Range,高精确度动态范围) OpenEXR技术、支持FP滤波、纹理、混合。改进的Intellisample 3.0,支持16×AA,改善了压缩性能;支持HCT(高分辨率压缩),它是一种全新的色彩、纹理和Z buffer在所有模式中的无损压缩算法,并具有高分辨率高频率和快速Z buffer清除功能。采用了UltraShadow Ⅱ技术,在大量阴影化应用游戏如Doom Ⅲ中,与上一代GPU相比可提高4倍性能。

  NV40还增强了温度监控和管理功能,增强了显示和视频输出功能,如NVIDIA Digital Vibrance Control (DVC) 3.0和NVIDIA数字振动控制3.0。在API方面,NV40支持最新的DirectX 9.0和OpenGL 1.5。

  扑朔迷离的渲染管线

  NV40内建16条像素渲染管线,而非以前外界普遍推测的8条像素渲染管线。

  相比之下,传闻ATi的R420使用的是12×1的渲染架构,现在我们还不能断定到底是R420还是NV40在实际游戏中速度最快。具体的性能比较结果可能要等到这两款显卡在零售市场见到之后才能确定。

  虽然关于渲染管线的传闻有很多,但从技术上来说,由于显示芯片的渲染管线就像CPU的流水线一样,反映了显示芯片的性能。如果渲染管线的数量越多,那么在进行图像处理的时候性能就越强。我们知道,Prescott CPU的流水线已经比Northwood P4的20级流水线增加了50%,但副作用就是高功耗。那么同样,增加到16条渲染管线的NV40,其功耗也是相当惊人的,因此NV40的外接电源接口较NV30又增加了一个。初步估计,NV40芯片的功耗达到了70瓦,再加上GDDR3显存的30瓦功耗以及其他元件的功耗,这样一块显卡的功耗竟超过了100瓦,也就是说,必须选择超过300瓦的电源才能使它正常运行。

  多胞胎策略

  我们从NV30发布后就看到了NVIDIA相当高明的市场操作手段。从一系列的XT、SE以及LE版本的核心芯片可以看出,一颗标准的芯片都会有众多的孪生姐妹。只要新的芯片一推出,必然是“双胞胎”甚至多胞胎,绝对不会是“独生子女”。一段时间内,其兄弟姐妹也纷纷上阵,显示芯片市场就变得热闹非凡,不光一般的消费者看不懂,一些老鸟也会看走眼。在老大出生以后,伴随着增强版,随之而来的XT、SE等版本必然出现。按以往的经验来看,最初的NV40一定是NV40 Ultra版和标准版,然后将是XT版出现。这些版本的不同之处就是核心工作频率的不同而已,至于显存频率则取决于显存颗粒的品质。

  无独有偶,ATi也是这样的。一种芯片可以衍生出SE、LE、XT等版本,为了占领市场无所不用其极。当初的Radeon 9500 Pro、Radeon 9800SE被许多DIYer打开被关闭的渲染管线,其实这些被用来作为卖点的技术参数,经过一些硬件改造或者软件工具修改就可以搞定。但厂商又为何搞出这么多的版本来呢?笔者认为,这样做一来可以消化掉相当一部分质量达不到标准的次品芯片;另一方面也需要不同的产品来丰富其产品线,如果只有一种产品,那利润也就太少了点。

  所以,显示芯片是鼓励“多生”的。

  显示芯片进入性能怪圈

  每一次显示芯片的升级换代,从很多物理参数就能看出变化之大。NV40的晶体管数量基本上比NV30翻了一番。由于NVIDIA发誓要夺回自NV30开始丢失的性能王冠,因此NV40图形芯片内建的晶体管数目也从1.25亿个,提升到了2.22亿个。不过,ATi还是对R420的性能超越NV40充满信心。ATi透露R420发布之后,在主要的10个游戏上的性能都将超越NV40。不过,ATi这种预测仍然是根据老的NV40集成1.75亿个晶体管,内建8条像素渲染管线的老情报进行的估算。现在NVIDIA已经将NV40发布日期从3月CeBIT2004大会延期到4月14日,ATi的R420实际性能以及晶体管数量在正式发布之前仍然相当神秘。

  不论NV40还是R420的实际晶体管数量如何,目前显示芯片性能提高的惟一的方法就是增加晶体管数量。增加渲染管线,也相应地增加了功耗。这仿佛是一个怪圈,性能提升也只能依靠这些了,图形芯片的晶体管数量早已超过了CPU的晶体管数量,而性能仍然不能让人完全满意,这不能不说是一个怪事。

  笔者想要说的是,真正体现在核心上的变革并没有出现,这不能不说是一种遗憾。

  写在最后

  据悉,NV40将由IBM代工生产,初期仍将采用0.13微米工艺。根据相关报道,IBM已经开发出了新的名为“Fluorinated Silicate Glass (FSG)”的新技术,这项技术将广泛应用于目前的0.13微米工艺的芯片上,以提高良品率。和NV30交付给TSMC的0.13微米生产线不同的是,虽然NV40也仍将采用这一级别的工艺生产,但毕竟晶体管数量增加了一倍,IBM的工艺看来更加成熟。而0.09微米的制程产品在不久以后利用Low-K技术才能真正上市(据ATi透露的资料显示,R420也将采用Low-K技术)。NV40将采用两个电源接口供电,但只占用一个AGP插槽。

  GeForce 6800 Ultra零售价格将是499美元,而GeForce 6800标准版价格为299美元。NVIDIA已经向其合作厂商提供NV40图形芯片,显卡将在45天内进入零售市场。NV40图形芯片将由IBM负责生产,采用0.13微米工艺。

  然而性能大战刚刚开始,这台好戏还要看ATi的R420的表现如何,我们拭目以待。

  技术解读:渲染管线和CineFX3.0技术

  渲染管线作为引擎最重要的功能之一,当3D模型制作完毕之后,美工会按照不同的面把材质贴图赋予模型,这相当于为骨骼蒙上皮肤,最后再通过渲染引擎把模型、动画、光影、特效等所有效果实时计算出来并展示在屏幕上。渲染管线就相当于处理这一系列工作的工作者。渲染管线的快慢直接影响图形最终生成的快慢,虽然GPU可以在一秒钟内处理相当多的三角形,但需要依赖渲染管线来进行贴图等即时处理。所以它的强大与否直接决定着最终的输出质量。

  NVIDIA GeForce 6系列图形芯片最引人注目的技术就是最新开发的,NVIDIA独有的CineFX 3.0引擎了。

  CineFX 3.0完全支持微软DirectX 9.0中的Shader Model 3.0,这个最新版本的Model包括大家非常熟悉的Vertex Shader 3.0以及Pixel Shader 3.0。CineFX 3.0还支持支持最初由SGI提出的OpenGL 1.5。另外,CineFX 3.0还支持微软的High-Level Shader Language(HLSL,高级渲染器语言)、OpenGL Shader Language(OpenGL渲染器语言)和NVIDIA自己开发的CG着色环境──能够让游戏编程人员轻易将DirectX和OpenGL结合起来的编程环境。