世界因它们而精彩——3D图形芯片10年史(六)

硬件周刊

  ST:初露锋芒

  2001年3月,ST推出了KYROⅡ。支持FSAA 2×和4×,支持环境凹凸贴图和DOT3凹凸贴图,32位Z-buffer,无论在16/32位模式下都支持Stencil模板缓存,128位的2D引擎,出色的DVD解码,支持64MB 128位SGRAM/SDRAM显存;内部32位色彩渲染和8重纹理贴图给我们带来了无可挑剔的3D图形质量。并且由于KYROⅡ使用了0.18微米工艺,核心与显示内存频率都从125MHz提高到了175MHz,整体性能相对KYRO提高了约40%!

  KYROⅡ虽然性能不俗,但真正让KYROⅡ出名的却是NVIDIA。NVIDIA在一份文件中极力贬低KYRO Ⅱ,用了很大的篇幅说明KYROⅡ的速度慢、画面差,而且没有经过实际使用的验证,并且用停货威胁各厂家不许生产KYRO系列产品。但是大力神(Hercules)还是坚持推出了KYROⅡ显卡,这使得人们对KYROⅡ越发好奇起来,更加想一睹其风采。随后我们惊奇地发现,在FSAA(全屏抗锯齿)的条件下,KYROⅡ有时竟能比GeForce2 Ultra更快!

KYROⅡ

  KYROⅡ既没有T&L、也没有DDR显存支持,真正让NVIDIA“恐慌”的是其HSR(隐面去除)带来的高速FSAA。而且紧跟着KYROⅡ后面的就是划时代的STG5000也就是KYROⅢ:HSR型的T&L支持、更高的工作频率和成倍增加的渲染管线,将带来数倍的速度提升,而且继承KYRO系列一贯的低价,无疑会给NVIDIA造成极大的威胁(可惜,ST的研发速度太慢了,KYROⅢ最终还是胎死腹中,ST直接跳到了KYROⅤ的研发,希望KYROⅤ不要再让我们失望)。

  NVIDIA:再创新高

  2001年2月22日,NVIDIA发布了GeForce3图形芯片。与以往的产品不同,这款产品并不是对应PC平台的,而是一款对应苹果电脑的图形芯片,这是NVIDIA首次在非PC平台上推出新产品。2月27日,PC版的GeForce3也终于发布了。

  GeForce3图形芯片的晶体管数目多达5700万个。NVIDIA的早期产品RIVA 128不过才700万个晶体管,GeForce2 GTS也不过只有2500万个晶体管,当时最大的敌手ATi Radeon芯片也不过3000万个晶体管,甚至处理器霸主Intel的P4也只有4200万个晶体管。为了不让芯片面积过大,同时有更高的运行频率与更低的电压,GeForce3采用了当时先进的0.15微米工艺。

  GeForce3是首片真正意义上的GPU,因为它第一次实现了完全可编程的完整3D图形处理流程,其内置的nfiniteFX引擎是业界首个完全可编程的3D图形芯片架构,NVIDIA为游戏开发者提供了完整的GeForce架构开发工具,允许游戏开发者编制他们自己的程序来控制像素的效果,给游戏和应用开发者带来了极大方便。

  nfiniteFX引擎由两个部分组成:一个就是Vertex Shader(顶点渲染)引擎,第二个就是Pixel Shader(像素渲染)引擎。

  顶点渲染可以说是GeForce3最重要的新技术。通过顶点渲染引擎,程序设计师能够对特定物体,甚至整个画面的每一个顶点,指定特别的运算程序,而不需要CPU干预。通过顶点渲染技术,可以大大提升3D细节的效果,图像可以变得更加真实生动。

GeForce3

  同顶点渲染引擎类似,GeForce3的像素渲染引擎也是可编程的,拥有四条渲染管线,每条管线每个周期同样可以处理2个纹理,最大像素填充率为1.6G Texels/s。GeForce3的像素渲染引擎对贴图过程进行编程处理,用简单的贴图就可以做出复杂的表面效果。而且还可以使用根本不存在的材质表面来实现贴图。这种贴图方式可以针对所有的3D物体,免去了对各个物体逐一贴图的麻烦。除了效果方面的优势以外,GeForce3的像素渲染引擎还可以大大简化3D编程,减轻开发人员的工作量。

  NVIDIA在GeForce3中还使用了全新的硬件HRAA──高清晰度反锯齿技术来实现FSAA全屏反锯齿效果。牺牲较小的性能来达到和FSAA一样的反锯齿效果,大幅节省了带宽。

  为了解决在显存带宽方面的瓶颈,NVIDIA采用了Lightspeed Memory Architecture(LMA,光速交错式显存架构),这种交错式显存控制器能更有效率地利用显卡内存带宽,最高时显存带宽利用率可提升3倍。同时,NVIDIA也采用了无损Z轴数据压缩、Z轴遮挡剪切等大量节省带宽的技术。另外,NVIDIA还首次在主流显卡中引入了实用化的高阶曲面,通过将许多的小三角形换成简单的曲面形式,GeForce3大大简化了3D空间形状的表达方式和数据量,而且完全硬件处理的曲面也更加细腻、真实。

GeForce2 MX400

  在继续称霸高端市场的同时,NVIDIA也没有忘记巩固中低端市场。应对ATi细分Radeon系列产品,在中低端大幅扩张的策略,NVIDIA在3月对其经典的GeForce2 MX进行了细分,依频率的不同分为MX100,MX200,MX400三款产品。这样就彻底淘汰了为NVIDIA立下汗马功劳的TNT2系列显卡,从而使GeForce显卡遍布了从低到高的整个显卡市场。

  8月,随着Radeon 8500的发布,NVIDIA的性能之王的桂冠落入他家。为了夺回被Radeon 8500夺走的性能之王的桂冠,10月1号,NVIDIA发布了GeForce3 Titanium和GeForce2 Titanium系列图形芯片,从高到低分为GeForce2 Ti,GeForce3 Ti,GeForce3 Ti200,GeForce3 Ti500四款。实际上,GeForce2 Titanium和GeForce3 Titanium系列不过是超频版的GeForce2和GeForce3图形芯片加上新的BIOS和驱动程序而已。不过就算如此,这一点点的性能提升也让GeForce3 Ti成功地赶上了Radeon 8500,让NVIDIA把性能之王的桂冠一直戴到了2002年。

  ATi:渐入佳境

  长久以来,ATi一向把苹果平台和移动市场看做自己的后花园。在OEM和DIY市场面对众多对手挑战,利润不断下降的时候,这两块市场也就分外被ATi看重了。NVIDIA对这两块市场的扩张让ATi震惊不已。2001年,在巩固苹果和移动市场的同时,ATi也向NVIDIA的桌面PC市场发起了冲击。年初,像NVIDIA一样,ATi将Radeon划分出了LE和VE两个版本。相对Radeon,Radeon LE屏蔽了Hyper-Z功能,但售价也相应下降了许多,再加上很多Radeon LE都可以打开屏蔽的Hyper-Z从而摇身一变成为Radeon,这对许多DIY玩家更是有着绝对的吸引力,结果在中国市场着实火了一把。Radeon VE则是面向商务市场,不具备T&L,而且只有一条渲染管线。但其强大的双头显示功能,优秀的2D画质再加上低廉的售价,占领了办公和商务的大部分市场。

Radeon 8500

  5月,ATi宣布开放芯片授权,允许第三方厂商生产基于ATi全系列芯片的产品。这个决定,在零售市场尤其是亚洲市场,给了NVIDIA相当大的压力;同时,这个决定也催生了许多显卡厂商,不少显卡厂商就是因生产ATi的显卡而一炮走红,从此也就有了NVIDIA阵营和ATi阵营的概念,用户和厂商都有了更多的选择。

  8月14日,ATi发布了传说中的R200──Radeon 8500图形芯片。6000万的晶体管数打破了GeForce3的记录,也给我们带来了更多的惊喜。通过SmartShader技术,Radeon 8500可以实现Vertex Shader、Pixel Shader的效果,全新的像素引擎Pixel Tapestry Ⅱ包括4条像素渲染管线,每条管线由2个TMU(材质贴图单元)组成,再加上一个当时惟一支持DirectX 8.1的可编程像素着色器PPS(Programmable Pixel Shader),Radeon 8500能够支持单周期高达6次的纹理贴图,并且可以接收更长的程序指令(每个程序22条指令,而GeForce3为12条) ,同时实现了对DirectX 8.1的完全支持。

  Radeon 8500还采用了Hyper-Z的改进技术:Hyper-Z Ⅱ和新一代的T&L引擎:Charisma Engine Ⅱ。尽管Radeon 8500显存的理论峰值带宽只有8.8GB/s,但是借助Hyper-Z Ⅱ,Radeon 8500显存的实际峰值带宽可以飙升到12GB/s。Radeon 8500的核心频率和显存频率分别为275MHz和550MHz,全面超越了GeForce3,再加上Charisma Engine Ⅱ引擎两条并行管线的强劲性能,Radeon 8500每秒可以生成高达6000万个三角形,超过了GeForce3每秒4000万个多边形的速度。同时,Radeon 8500也是首款支持双显示器的高端3D显卡,通过HydraVision技术它可以混合使用普通显示器、数字接口液晶显示器以及电视等。

Radeon 7500

  在FSAA方面,Radeon 8500提供了一套动态的FSAA解决方案──SmoothVision。与GeForce3的HRAA相比,SmoothVision可以达到更好的画面效果,HRAA虽然可以很好地节省带宽,但它不能解决画面模糊的问题,而且HRAA只能实现2次MultiSampling,4个取样点,而SmoothVision则可以最高实现4次MultiSampling,16个取样点的有效操作,效果自然就更胜一筹。

  但是Radeon 8500并不完美,例如它采用的Pixel Tapestry Ⅱ。ATi声称Pixel Tapestry Ⅱ包括4条绘图管线,而且可以在每个周期中处理单个像素中的3个纹理,但是事实上Radeon的3纹理单元设计并不成功,利用率很低,大部分时间都只有2个在工作。还有其Truform技术,通过增加更多小三角形来替代原有大三角形的方法来表现物体表面,尤其是曲面,可以在节省带宽的前提下,实现相对复杂的光影效果,提供更加复杂、真实的画面。它可以应用在任何3D游戏上而且不会降低性能。但由于支持的厂商很少,而且会带来比如CS中枪支扭曲等诸多问题,在此后的ATi的产品中也就不再硬件支持这一技术了。

  Radeon 8500发布的同时,ATi也发布了Radeon的改进版,Radeon 7500图形芯片,它的核心频率提高到了290MHz,成功的具有了和GeForce2系列图形芯片对抗的能力。ATi也对自己的全系列产品进行了重新命名,标准版的Radeon更名为Radeon 7200,原来的Radeon VE更名为Radeon 7000,用数字大小表示性能高低。

  最后,依惯例是2001年的总结: