进攻和防守——显卡
特别策划
2005年的显卡市场是一个攻守势态非常明显的市场,也是一个在跳票背后孕育着无限可能的市场。当NVIDIA完善了GeForce7系列产品,而ATi宣布R520具备革命性意义的时候,DirectX 9.0时代的最后一块基石已经奠定下来。
王者之风
相对于以往6~12个月就升级是换代一次的显卡市场,2005年上半年却很平静的,这份平静直到6月NVIDIA推出代号G70的GeForce 7800GTX才被打破。在这之前,NVIDIA公司的NV40/45系列产品在性能上与ATi 的R4xx系列只是打了个平手,不过到了G70情况发生了变化,以NV40/45为蓝本的G70性能增强不少,大多数时候是以擂主身份在迎接ATi产品的挑战。
从架构上来看,G70最明显的变化是集成的晶体管数目从前代的2.22亿个提升到3.04亿个。晶体管数目提升带来的直接变化是,像素渲染单元(Pixel Shader)从16个提升到24个,顶点渲染单元(Vertex Shader)也从6个提升到8个。从实际表现来看,即使除去频率因素影响,GeForce 7800GTX比上代的GeForce 6800Ultra在不同场合下也有15%到40%的性能提升,相当强悍。
G70让我们看到“量变”的同时,在细节上还有不少质变。G70在Vertex Shader和Pixel Shader部分有两个很醒目的变化,增强了Vertex Texture Fetch的效率和提高了MADD(Multiply-ADD)效能。
从G70的内部结构上来说,在Vertex Shader单元内部有一个32位浮点的标量单元和一个32位浮点的向量单元,还包括一个Vertex Texture Fetch单元。VTF单元非常重要,顶点单元内动态取样,动态变更和加入几何LOD的方便程度都和它有关,在位移映射、硬件碰撞与光线追踪、高阶硬件皮肤等场合可以明显体现出VTF单元的重要性。
VTF单元的增强是G70的主要变化之一,也是今年显卡领域最热门的话题之一。VTF部分具体的变化,主要是预取算法的更新以及预取存储容量方面的改进。在未来的SM4.0中,位移映射等技术的地位还会显著提高,加强VTF部分的设计不仅提高了显卡在目前应用中的效能,也是NVIDIA在硬件架构上的未雨绸缪。
在Pixel Shader部分,G70的变动也不小。MADD是一条非常常用的指令,在诸如Relief Mapping(地图映射)等技术中应用得相当广泛,提高MADD效率对提升显卡整体性能的意义相当大。GeForce6系列显卡只有一个ALU有MADD功能,在G70的Pixel Shader部分,两个ALU都具备了MADD运算能力,且G70的Pixel Shader单元数目增加了50%,叠加这两个因素,G70的MADD运算能力可以达到前代的3倍。
从Vertex Shader到Pixel Shader,G70在细节的提升不少而且有实效。2005年显卡王者争霸战,GeForce 7800GTX让我们牢牢地记住了这三个词语:像素渲染管线、MADD和VFT。
在产品层面上,GeForce 7800GTX(包括512MB版本)更多的只是象征意义,上半年的中高端主流产品是2000元以下的GeForce 6800标准版和2000元以上的GeForce 6800GT,而到了年末他们的地位就被2499元的GeForce 7800GT和价格更低的GeForce 7800GS所取代。
回顾2005年,NVIDIA在中高端产品上的市场策略——像素管线数目逐步提升、用GeForce 7xxx系列显卡全面取代GeForce 6xxx系列显卡。这个策略的结果是,中高端显卡的起步像素管线从年初的12条转为16条,整体性能也提升了20%左右。

迟到的X1000
2005年显卡领域的王座在很长一段时间内被GeForce 7800GTX所把持,它的老对手ATi自然也不甘心于这种状况。ATi对G70发起挑战的新武器就是R520,在今年最后几个月研发代号为R520的Radeon X1000系列显卡终于出现在企盼已久的用户面前。
连续跳票之后,要击败称王的对手,至少要拿出一些手段。R520自发布开始,一个名为R2VB技术就吸引了不少用户的注意,并成为显卡领域2005年最后几个月讨论得最热烈的词语。
R2VB并不是第一次出现而且实现并不复杂,R520的Pixel Shader能输出包含4个FP32分量的128位浮点格式数据,把这些数据存放到4字符编码的顶点缓存,然后直接作为顶点数据传输给顶点着色器,这就是R2VB的工作流程。R2VB也能达到纹理取样的效果,但其实现方式和NVIDIA的VTF完全不一样。
支持R2VB的一方认为,节约下VTF部分花去的晶体管用在更需要的地方,这对整体性能是有帮助的创举。反对R2VB一方认为,在流程有优化的情况或者需要动态变更的场合,VTF明显能提供更高的效率。
实际测试来看,R2VB和VTF目前性能基本相当,但在未来VTF“升值”的潜力明显较大。到底是什么原因让ATi放弃了VTF这种设计,的确让人感到迷惑,不过可以肯定的是,R2VB这个词语让大多数用户从2005年起记住了它。
R520的顶点渲染单元(Vertex Shader)虽然和G70同为8个,但像素渲染单元(Pixel Shader)还是只有16个,由此导致的像素处理管线也只有16条。要和24管线产品对抗,除了极具争议的R2VB以外,至少还有两项不能让人忘记的技术:Ultra-Threaded Shader Architecture和环路总线技术。
Ultra-Threading Shader Architecture技术的采用目的很明确——提升像素渲染单元的效率。虽然R520只有16个像素渲染单元,但是有了Ultra-Threading的良好调度,官方宣称其利用率可以超过90%。从长远来看,无限制增加Shader数目显然不是一个好主意,利用异步来提升管线利用率是未来的一个重要发展方向。从这个意义上来说,Ultra-Threading绝对是一个值得记住的显卡架构,也是ATi可以沿用相当长时间的架构。
环路总线其实是R520系列显存优化技术的一个总称,目前在高端显卡方面,显存控制器部分是显卡发展的瓶颈之一,也是大厂注目的焦点。在R520上仍旧采用的是256bit位宽的显存控制界面,但是它抛弃了4个64bit的架构转为8个32bit的架构,这对零散数据的存取更为快捷。
R520内部的带宽达到了512bit,同时采用的是两组双向256bit环路总线组成环路拓扑结构。随着GPU越来越复杂,需要连接到内存控制器的处理单元越来越多,如果继续维持完全采用原来的Crossbar Switch架构,连接与控制会变得非常复杂,步骤过多带来的延迟和步骤复杂带来的发热、功耗、信号串扰都是让人很头痛的。环路总线架构在一定程度上解决了这一类问题,无疑这也是显卡发展过程中很值得一提的技术。
有了良好的技术和产品作为基础,还需要有良好的产品线,这样才能在充满竞争的市场上获得成功。在2005年年底市场上,GeForce 7800GT在2499价位上风光无限,但ATi的应对策略也非常高明。Radeon X1800系列中的XL和Pro版,都是16管线的产品,和顶级的Radeon X1800XT的差别只是频率,用这两款产品夹击GeForce 7800GT。如果还考虑前代的Radeon X800XL,那就是真正的“三英战吕布”了。

Radeon X1800LE和Radeon X1600XT,是ATi在中高端布下的第二道战线,目标当然是直指GeForce 7800GS和GeForce 6800GS这一档次的产品。Radeon X1800LE只是像素管线略微缩减,凭借R520良好的架构和对手竞争还是有相当大的周旋余地。Radeon X1600XT是基于RV530核心的主流产品,它具备5个顶点渲染单元和12个像素渲染单元,核心和显存频率分别为590MHz和1380MHz。在能力上可以对较老的GeForce 6800GS形成一定威胁,如果ATi对其Render Back End(RBE)单元和纹理单元数目加以提升,竞争力将更为强大。
技术对垒
只会卖产品的厂商是永远难成大器的,在关注显卡市场时更不能忽视领袖厂商们提出的概念。SLI与CrossFire、PureVideo和AVIVO,是两家显卡领导厂商在技术上的两次激烈碰撞。
在3dfx时代,玩家就从Voodoo2 SLI中看到这项技术的辉煌前景,随着PCI Express平台的出现,NVIDIA再次在产品中推出了SLI概念。虽然SLI概念和产品的正式推出并不在2005年,但它开始走向平民化的确是在今年。
SLI技术走向主流的标志性事件是,NVIDIA在GeForce 6600GT这类主流领域的显卡上实现SLI功能后,旋即对GeForce 6600标准版的SLI解禁,甚至普及到了GeForce 6600LE。从显卡的角度来说,SLI已不再是评测室中工程师们的玩物。
从主板芯片组的角度来看,nForce4 SLI的普及也为玩家用上SLI系统做好了准备:在驱动上,NVIDIA也经历了从不能支持、部分支持到完全支持的过程;桥接、品牌、速度、超频等本来是SLI障碍的东西已不复存在。2005年,是SLI技术真正兴起的一年。
ATi自然也不会放弃“多显卡协同工作”这块市场,虽然没有3dfx留下的技术财富,但ATi也研发出了自己相应的技术——CrossFire。从技术角度来看,两者目前有一些差异。在目前这个阶段CrossFire对协同工作的显卡要求比较松,即使是不同芯片的显卡,只要具备一块CrossFire主卡,加上BIOS的协调就可以协同工作。而SLI技术基本上需要芯片一样的显卡,才能比较好地协同工作。

一个人的力量总是有限的,多显卡协同工作技术的推出,对显卡的发展有着相当积极的意义。目前双显卡已经可以取得单显卡150%~170%的性能,这让早期双显卡和单显卡相比技术并不占优的情况一去不复返。支持双显卡,并且能让双显卡技术充分发挥的游戏在2005年里也越来越多。
PureVideo和SLI一样,是NVIDIA在去年推出的概念,但在今年它才随着GeForce6/7系列显卡的普及真正走入用户视野。
这是一系列关于视频编解码、播放画质等有关技术的总称,在实际应用中也确确实实能提升视频播放的画质、降低视频播放对CPU的占用。
ATi的AVIVO是和NVIDIA的PureVideo针锋相对的技术,在具体技术层面上相似之处相当多,它们也都是为了让用户拥有更好的视觉体验而推出的。显卡并不只是为游戏服务的,视频播放也是重要的领域,特别是针对目前越来越红火的HDTV。PureVideo和AVIVO的推出说明了显卡厂家终于开始注意非游戏玩家的实际需求了。
AVIVO和PureVideo比较有三点不同之处,首先是AVIVO更强调视频系统的概念而非显卡内部的技术;其次是在色彩输出上AVIVO有了长足的进步,达到了10bit也就是10亿色的输出;最后就是对H.264的解码能力支持度较高,而且对软件优化的兼容性、易用性这个领域一直比较重视,做得比对手也更好一些。
激战中低端
中低端永远是最值得关注的也是最活跃的市场,我们来看看即将过去的这一年中低端显卡市场的变化。
主力产品——三强争霸
GeForce 6600GT采用是110nm的NV43核心,具备3个顶点渲染单元和8个像素渲染单元,128bit显存位宽,这几乎己经成为2005年主流产品的标准。完全支持SM3.0加上不俗的性能,GeForce 6600GT一直是中端用户的首选,今年以来的价格从最初的1099元~1499元,岁末已经全面落入999元以下了。
在ATi方面,整个2005年上半年最能唤起市场注意的就是Radeon X700系列产品了。各大厂家在5月初齐刷刷以999元推出用GDDR3显存的Radeon X700,这是今年市场上最值得回味的场景之一。Radeon X700主要分为标准版、Pro版和XT版三种,但这三种都是基于110nm的RV410核心产品,都具备6个顶点渲染单元和8个像素渲染单元,它们之间的区别只是核心、显存的默认频率而已。
面对X700的价格攻势,NVIDIA的对应之策就是推出GeForce 6600标准版。从架构来看,标准版和GT版几乎完全一样,都是110nm的NV43核心,也具备3个顶点渲染单元和8个像素渲染单元和128bit显存位宽,唯一的差别就是核心频率只有300MHz,而显存频率只有550MHz。
从今年夏天开始,采用GDDR3显存的超频版GeForce 6600就出现了。不少品牌的这类显卡选择GT版的底板,核心直接超频到450MHz,然后再辅以超频能力出众的GDDR3,性能直逼GT版。加上NVIDIA为标准版也开放SLI功能,使GeForce 6600标准版成为中端主流市场很火的一款产品。
主流之上——双峰并峙
在主流价位之上100元到300元的价格区间内,还有一些性价比不错产品。在上半年市场上,NVIDIA公司这样的产品是GeForce 6800LE,在GeForce 6600GT降价之后,GeForce 6800LE就摇身一变成为了GeForce 6800XT,价格处于999元-1299元之间。

和GeForce 6800标准版相比,XT版顶点渲染单元少了一个,像素渲染单元少了四个,但是在核心频率包括使用的GDDR3显存上却更胜一筹。而且在价位上正好弥补了GeForce 6600GT和GeForce 6800标准版价格之间的这一段空间,较受市场追捧。
2005年下半年,ATi在X700之上发布了Radeon X800GT。我们可以将X800GT理解为内存位宽为256bit的X700,在显存搭配上它有GDDR版也有GDDR3版,频率分别是700MHz和1000MHz,搭配相当灵活。

目前Radeon X800GT主要是蓝宝等几个厂家出货,价格在1099元-1499元之间,也和对手有着较为激励的市场竞争。GeForce 6800XT和Radeon X800GT,无论在名字上还是在实际性能上的斗法,是2005年显卡市场的一大看点。
低端斗法——实用主义的胜利
在GeForce 6600标准版之下还有LE版本的产品——GeForce 6600LE,这是一款3顶点渲染单元和4像素渲染单元的产品。GeForce 6600LE可以看作顶点和像素部分被折半,其它部分基本不变的GeForce 6600标准版。因为显存搭配的灵活(DDR3版本的表现不错),在4管线的低端这也是一个有竞争力的产品。
在中低端显卡的零售市场上,ATi的表现明显强于对手。历久弥坚的Radeon 9550竟然还能在今年上半年的市场上出尽风头,到了下半年4管线的热点渐渐转到了Radeon X550上,这款号称PCI-E接口的Radeon 9550,以较低的价格赢得了不少用户的青睐。GeForce 6600LE虽然可以用SM3.0的性能来吸引人,但是价格和性价比在低端市场似乎更重要。
在接近年底的时候,Radeon X1300系列显卡将继续强化ATi在低端市场的优势。Radeon X1300是基于RV515核心的产品,它有两个顶点渲染单元和四个像素渲染单元,核心频率600MHz,通常采用800MHz、256MB容量的GDDR2作为显存。
在实际表现上,这种频率的Radeon X1300Pro比较抢眼,甚至可以对8管线的GeForce 6600标准版发起挑战。虽然目前Radeon X1300Pro新品上市还在800多元的价位上,但在圣诞和新年期间,经过价格调整,其接替Radeon X550引领4管线低端市场还是有可能的。