世界因它们而精彩——3D图形芯片10历史(八)

硬件周刊

  S3:重返江湖

  自从被VIA收购之后,S3更多地专注于移动和整合市场,但是2003年1月7日,S3却发布了DeltaChrome,这是一个针对桌面市场的图形芯片系列。DeltaChrome系列图形芯片采用0.13μm工艺,全面支持DirectX 9,分为DeltaChrome F1/S8/S8 Nitro/S4四款。DeltaChrome系列图形芯片中内建Chromotion引擎,可以对各种视频进行后期画质处理和构造视频特效,实现去斑、降噪、浮雕、锐化等特效。DeltaChrome系列还是第一个内建HDTV处理器的图形芯片,可以直接实现HDTV输出。

  DeltaChrome

  DeltaChrome系列图形芯片的规格在当时来说还算过得去,原定在2003年2月实物上市,结果至今也只能看见少得可怜的样品。

  NVIDIA:亡羊补牢

  2003年3月6日,为改变中端DirectX 9图形芯片市场被ATi 9500系列独揽的局面,NVIDIA发布了NV31(GeForce FX 5600)和NV34(GeForce FX 5200)3D图形芯片。

  5600系列具备Vertex Shader 2.0+和Pixel Shader 2.0+,支持诸如Intellisample、色彩缓存压缩等新技术,但是其渲染流水线也由5800的8条减到了4条,每一渲染流水线具备1个材质处理单元,每个时钟周期可以渲染4个像素,晶体管数减到了8000万个。NVIDIA终于拥有了主流的DirectX 9图形芯片,不必再依靠老迈的GeForce4 Ti4200-8×来对抗ATi的9500系列图形芯片。

   GeForce FX 5900

  5200最大支持128MB的DDR显存,而且晶体管只有4700万个,改用0.15μm工艺,进一步控制了成本。但5200的填充率只有1000M Texels/s,只是比GeForce4 MX440-8×略高,更多是面对那些对性能要求不高的家庭用户。

  2003年5月12日,NVIDIA发布了新一代3D图形芯片──NV35(GeForce FX 5900),采用0.13μm工艺,比5800显存带宽提高了约70%,达到了27.2GB/s。5900解决了热量、噪音、显存带宽等不足,成功的击败了Radeon 9800,夺回了久违的性能之王的宝座。之后不久5900的降频版的5900XT也悄悄问世了。

  2003年10月23日,NVIDIA又发布了NV38(GeForce FX 5950)和NV36(GeForce FX 5700)。作为5900改进版本,5950核心时钟频率仅提升了25MHz,达到475MHz,其核心架构没有任何变化。虽然5950的显存控制器重新增加了对DDRⅡ的支持,但是5950还是采用256bit DDR显存。但是显存的工作频率提升了,达到了950MHz,显存带宽也相应提高到了30.4GB/s。

  作为新一代的中端利器,5700仍然采用4条渲染流水线,每条流水线拥有1个材质处理单元,但是其核心频率和显存频率比5600系列提高不少,5700 Ultra更是采用了DDRⅡ显存。此外,5700还引入了不少5900、5950才有的技术,同时,NVIDIA还对5700的几何、像素处理单元的结构进行了改进。这些改进使得5700不但可以在阴影渲染方面实现更加逼真的效果,而且可以大幅度提高几何处理性能和全屏抗锯齿性能。

  ATi:春风得意

  同样在2003年3月6日,ATi也发布了自己新一代的图形芯片──R350(Radeon 9800)、RV350(Radeon 9600)和RV280(Radeon 9200)。相比GeForce FX 5800,9800系列增加了对Floating Point 3D Textures(浮点3D材质)、Floating Point Cube Maps(浮点立体贴图)、Multiple Render Targets(多点目标补偿)、Displacement Mapping(映射转移)技术的支持,更好地支持DirectX 9。同时SmartShader 2.1技术优化了显存控制器,使其在读、写数据时效率更高,而Hyper Z Ⅲ+更是提供了高达24:1的无失真Z轴数据压缩。同时,F-Buffer技术也提高了显卡的工作效率。

  Radeon 9800XT

  9600系列图形芯片采用了全新的0.13μm工艺,完整支持DirectX 9,支持128位浮点精度和SmartShader 2.1、HyperZ Ⅲ等诸多技术。相比9800,9600只有4条渲染流水线和2个浮点着色引擎,缩水了一半。

  2003年7月11日,ATi又在中国市场发布了9800SE。相对9800系列,9800SE只有128bit的显存位宽,同时也屏蔽了一半的渲染流水线,只有4条,但仍然可以通过改造打开剩下的4条。

  2003年9月30日,ATi又发布了R360(Radeon 9800XT)和RV360(Radeon 9600XT)。9800XT基于9800架构,只是做了小幅的修改。依旧是采用0.15μm工艺,采用DDR显存,同时核心频率和显存频率有一点提高。9800XT增加了一个热敏二级管,可以监控核心温度,风扇也相应具有了2D和3D模式的区别。同时,9800XT增加了OverDrive功能。芯片核心温度不高时,OverDrive功能将自动提升核心工作频率来提升性能,而当核心温度升到临界关机温度时,OverDrive则将核心工作频率自动降到默认频率。

  对比9600系列,9600XT最主要改进之处就是采用了低介电系数材料,可以工作在更高的核心频率下,同时核心热量也进一步得到了控制。同时9600XT也同样增加了热敏二级管和OverDrive功能。

  XGI:旧瓶新酒

  2003年9月,新成立不久的XGI发布了Volari图形芯片,包括Volari V8/V5/V3三款。

  Volari Duo V8

  Volari系列图形芯片采用了XGI新一代的TruShader 2.1引擎,完整支持Vertex Shader 2.0和Pixel Shader 2.0,其中V8系列具备4个Vertex Shader(顶点着色引擎)和8个Pixel Shader(像素着色引擎)。通过其独有的BitFluent技术,Volari系列图形芯片可以实现双芯片并行处理,其Duo V8相应就拥有了8个Vertex Shader和16个Pixel Shader!而且在双芯片并行情况下,Volari系列图形芯片可以拥有2×128bit=256bit显存带宽。

  Volari系列图形芯片还使用了XGI专利的BroadBahn架构,将128位总线划分为4条独立的32位通道,可以大幅度提高多任务性能。其独有的Cipher Video与ColorAmp技术可以有效改善各类视频回放的效果,提供最精确的色彩和亮度。

  接下来,我们给2003年做一个总结。

  展望未来

  2004年4月13日,NVIDIA发布了新一代的3D图形芯片──NV40(GeForce 6800)。该产品集成了2.2亿个晶体管,采用了革命性的超标量架构,拥有CineFX3.0引擎,采用高精度动态范围(HPDR)、Intellisample 3.0、UltraSHadowII等技术,支持DirectX 9.0C和OpenGL1.5,拥有16条渲染流水线,显存也改用GDDR3,性能较5950有了大幅度的提升。

  2004年5月4日,ATi的R420也正式发布,集成了1.6亿个晶体管,采用256bit GDDR3显存,分为4个64bit通道。分别具有16条和12条渲染流水线的X800 XT和X800 PRO采用了全新3Dc材质压缩技术,提供4∶1的法线贴图压缩率,同时图像品质几乎没有变化。X800 XT和X800 PRO还使用了全新的Temporal FSAA反锯齿技术,可以提供更高的FSAA,生成更好的画质。

  在过去的10年,图形芯片的发展速度甚至超过了摩尔定律,将3D世界越来越真实地展现在我们面前。在这一过程中,出现过很多无法让我们忘怀的企业和产品,例如:3dfx、S3……;例如:Voodoo、G400、GeForce……在过去,每一次的产品发布都是如此的让人期待,总是能给我们带来许多新的技术,虽然未必都是成功的技术,但都充分体现了设计师的思想和他们对未来3D世界的展望。然而曾几何时,当半年一度的新品发布成了例行公事,我们突然发觉真正意义上的新产品已经消失了。例行公事的增加顶点流水线和渲染流水线,提高核心、显存频率和功率。或许不久的将来,我们的图形芯片也会像现在的CPU一样,完全用主频来表示性能,只是不断的冲击更高的频率而已。

  未来的3D图形芯片是怎样的呢?笔者在这里做一个大胆的预测。

  1.隐面消除技术

  在3D场景中,有相当多的部分是被遮挡住不可见的,尤其是在飞行模拟和赛车类游戏中,在复杂场景下最高可达30%。假如图形芯片能够判断哪些部分是不需要渲染的,避免渲染这些不可见的部分,在理论上说,可以提升10%到30%的性能,而且随着场景复杂度的增加,性能提升会更明显。

  2.反锯齿技术

  目前的图形芯片开不开反锯齿的得分差距是非常大的。虽然众多厂商提出过许多不同的反锯齿算法,但无论效果还是速度都还是无法让我们满意。希望占用极少的资源并能提供极好的反锯齿效果的算法能尽早和我们见面。

  3.嵌入式显存

  奔腾和赛扬的差距在哪里?不是在主频,而是在二级缓存,几百KB的二级缓存对性能的影响可以说是非常大的。在20世纪90年代,曾经有两个厂商投入过图形芯片嵌入式显存的研究,虽然此后都杳无音信,但无疑指明了一个不同的研究方向。或许在将来,图形芯片也将同样嵌入一级、二级显存,通过嵌入式显存来区分产品的档次。

  4.多核心技术

  无论是3dfx的VSA架构、ATi的MAXX技术还是XGI的BitFluent技术,都算是相当成熟的多核心技术。就目前而言,多核心技术虽然可以将性能非常简单的提高,但成本和功率的升高实在让人无法承受。但随着生产工艺提升的难度不断加大,研发新图形芯片的成本不断提升,或许在今后多核心技术会成为一个以有限成本大幅提升性能的方案。

  将来的图形芯片到底是怎样的,我们只能够拭目以待,但可以肯定,一个越来越真实的3D世界正逐渐展现在我们面前……