公正的对决——DX10显卡架构/效能深入剖析
特别策划
自从NVIDIA以及AMD发布第一款支持DX10的显卡以来,现在市面中销售的DX10显卡从入门到主流、从主流到发烧级已经有很多种不同架构、性能档次的产品,光是采用NVIDIA G92核心的就有GeForce 8800GT、GeForce 8800GS/9600GSO、GeForce 9800GTX、GeForce 9800GX2等,而AMD这边采用RV670的,也有Radeon HD3870/HD3850/HD3690等产品,这类产品都有个共同的特点,它们都采用同一架构的核心设计,但在频率、显存位宽与频率、流处理器数量等方面又有区别,从而划分出了性能定位等级。不过,由于NVIDIA以及AMD在产品规格的制定上并没有特别严格的要求,所以显卡厂商可以用同一款GPU/VPU制造出频率、显存位宽规格千差万别的显卡来,这就让用户在选择的时候很难有个明确的性能定位。
为了更好地帮助大家对市场中销售的DX10显卡性能进行定位,我们策划了本次DX10显卡架构/效能的主题测试。我们将市场中销售的DX10显卡GPU/VPU都放到统一的频率规格上来进行分析比较,将它们的性能等级彻底分析清楚,希望能对大家的选购有所帮助。
影响显卡性能的主要因素
流处理器数量
在GPU/VPU核心单元架构进入统一渲染时代以前,我们衡量一款GPU/VPU的性能最先想到的就是看它有多少条渲染流水线。而自从进入统一渲染架构时代之后,传统的渲染流水线概念已经不再适用,取而代之的是GPU/VPU所拥有的流处理器数量。
NVIDIA的G92拥有最多128个流处理器,AMD的RV670拥有最多320个流处理器,但我们不能认为RV670流处理器多,性能就一定好过G92,这与GPU/VPU材质单元、光栅单元以及流处理器的数据处理方式都还有很大关系的。但我们可以确定的是,采用同一架构的GPU/VPU,同频情况下,流处理器多的性能肯定要高。
核心频率
核心频率一直是影响显卡性能最直接的因素(NVIDIA显卡的Shader频率也是重要因素),一款GeForce 8500GT GDDR3版可以在核心频率很高的情况下,弥补流处理器数量较少的劣势,击败低频、DDR2版的GeForce 8600GT——这当然是不符合NVIDIA定位初衷的,但这种情况在市场中并不少见。举这个例子的目的就是要说明,高核心频率可以在一定程度上弥补架构上的性能劣势,但同时也会增加显卡的不稳定性和功耗,这也是一个需要平衡的问题。
显存位宽
当年DX9时代的128/64bit显存位宽之争可以说是对显存位宽重要性最好的诠释。在高分辨率材质的大量使用下,显存的位宽显得更加重要。千元以上的高端显卡大都采用了256bit的显存位宽,GeForce 8800GTX甚至采用了384bit的显存位宽,NVIDIA下一代高端产品也会将显存位宽提升到512bit。可以这么说,显存位宽几乎就成了界定显卡定位档次的重要依据——64bit针对入门级、128bit针对主流以及中高端产品、256bit以上才是发烧级。
显存频率
显存频率与显存位宽同时决定显存的带宽,而显存的频率和显存的类型有很大关系。从市场中的显卡产品来看,采用DDR2的大都为入门级产品,显存频率一般最高不会超过800MHz,而采用GDDR3的主流产品显存频率一般都能达到1.4GHz,甚至是2GHz。AMD采用GDDR4的Radeon HD3870显存频率甚至可达到2.16GHz。
当然,显存颗粒也在很大程度上影响了显卡的制造成本,因此市场中也出现了采用DDR2的GeForce 8600GT、Radeon HD3650等中端显卡,受制于DDR2显存较低的频率,这一类产品的性能也大打折扣;而也有厂商在低端显卡上使用高频GDDR3显存,使其性能甚至超过了缩水的中端产品。正是因为选择显存颗粒来调整显卡成本的可操作性很强,厂商也很热衷于此,这就使得市场中显卡产品规格更加混乱。
统一频率进行对比的意义
前面我们分析了影响显卡性能主要的几大因素,那么受到不同频率设定的影响,我们很难清楚地衡量市场中DX10显卡的性能定位等级以及它们之间架构不同带来的性能差距。将显卡核心频率以及Shader频率、显存频率都统一在同一水平之上,剩下不同的就是GPU/VPU的架构设计、流处理器数量、显存位宽——这些才是显卡性能定位的决定性因素。
尽量排除频率带来的影响之后,我们才能清楚地看到GPU/VPU实际的性能定位,了解了它们的性能定位,才能明白哪些实际的显卡产品在规格上是不合理的——不要以为装了发动机的牛车它就不是牛车了,同理,用牛来拉大奔也是不合理的做法。这样,我们才能正确地选择适合自己的DX10显卡。
本次测试中,我们将所有NVIDIA的显卡核心频率都设置为500MHz,Shader频率设置为1200MHz,显存频率设置为1.1GHz。AMD方面,核心频率与Shader频率是相同的,所以我们只将核心频率设置为500MHz,显存频率同样设置为1.1GHz(如果有显卡默认频率低于此频率,则超频实现)。接下来我们就可以看看,在同一频率起跑线上,相同核心不同流处理器数量、不同核心不同显存位宽的DX10显卡之间差距到底有多大,功耗差别到底有大,清楚地给它们划分一个性能等级。
参测显卡介绍

NVIDIA组
GeForce 9800GTX
核心代号:G92-420
核心频率:675MHz
显存位宽:256bit
显存容量:512MB

G92核心可以说是NVIDIA的GPU产品中相当灵活的一款,根据流处理器数量的不同,可以生产出不同档次的显卡来,从早期的GeForce 8800GT,到现在中端的GeForce 9600GSO,高端的GeForce 9800GTX与GeForce 9800GX2,都是采用的G92核心。
这款GeForce 9800GTX采用的则是G92中的G92-420,提供128个流处理器,具备16个光栅引擎,这与第一代的G80是相同的。显存方面,GeForce 9800GTX支持256bit的GDDR3显存,目前最高显存版配备了512MB的GDDR3。
GeForce 9800GTX定位比较高端,主流产品价格在两千元以上(部分品牌也推出有1400元的产品),直指游戏发烧友,当然和GeForce 8800Ultra相比还是有一定的性能差距,但这仍然不能掩盖它是一款发烧级显卡的事实,无论从性能还是功耗来讲,它都是一流的。
GeForce 9600GT
核心代号:G94-400
核心频率:700MHz
显存位宽:128bit
显存容量:512MB

G94是不同于G92的一款GPU核心,虽然都是采用统一渲染架构,但它们之间的关系并没有G92-150与G92-420那么密切。G92-150是G92-420屏蔽掉部分流处理器及光栅单元而来,而G94则是从硬件上就只有64个流处理器,不存在是哪款高端GPU“阉割”而来的说法。
和G92-420不同的是,G94主要面对中端主流市场,采用它的显卡就是GeForce 9600GT,目前有搭配256MB显存和512MB显存的两种,但不管是搭配多少显存,它都是采用的GDDR3、128bit的显存规格,暂时还没有使用DDR2以及64bit显存的“超低价格畸形缩水版”出现。
GeForce 9600GT的性能表现相当优秀,在核心频率700MHz的情况下,几乎就是千元左右DX10显卡中的王者,性能上可敌Radeon HD3870,价格上可比Radeon HD3850,经典程度可以比当年的千元王者GeForce4 Ti4200。
GeForce 9600GSO
核心代号:G92-150
核心频率:575MHz
显存位宽:192bit
显存容量:384MB
GeForce 9600G

SO是一款十分有趣的产品。它的前身就是NVIDIA针对OEM客户推出的GeForce 8800GS,后来发现在零售市场的销售情况不错,干脆换了个马甲,改名叫做GeForce 9600GSO,成为国内正式的零售产品。
GeForce 9600GSO采用的核心是G92-150,没错,它和GeForce 9800GTX一样都采用了G92核心,只是部分功能被从硬件上屏蔽了而已。流处理器从128个变成了96个,光栅处理器单元从16个变成了12个,显存位宽也减少为192bit,显存容量为比较奇怪的384MB——与早期的GeForce 8800GTS相同。
GeForce 9600GSO的市场定位其实要比GeForce 9600GT略低,不过考虑到规格上的此消彼长,我们还不能一眼就看出两者的差距,因此我们后面会有统一频率的测试来进行判定,这也是统一频率测试的意义所在。
GeForce 8600GT
核心代号:G84-300
核心频率:675MHz
显存位宽:128bit
显存容量:256MB
从GeForce 860

0GT开始,中低端显卡的规格就开始五花八门了,有采用DDR2的GeForce 8600GT,还有采用GDDR3、流处理器和GeForce 8600GT一样多的GeForce 8500GT,还有能用硬跳线直接从GeForce 8400GS变成GeForce 8600GT的……一般人保证会被厂商忽悠得晕头转向。其实所有这些招式无非是吸引眼球或者是降低成本,管你厂商怎么弄,只要弄清楚了GPU规格的定位,在购买的时候用GPU-Z看看显卡规格,就完全清楚了。这也是本次统一显卡频率进行测试的目的所在。
回到GeForce 8600GT上来,它采用的G84-300核心,具备32个流处理器和8个光栅单元(基本上可以认为与传统的8条渲染流水线相当),目前主要针对中低端用户,价格也在400~600元的范围内——价格变化范围大也正是因为GeForce 8600GT实际产品规格变化太多的缘故。
GeForce 8500GT
核心代号:G86-300
核心频率:459MHz
显存位宽:128bit
显存容量:256MB

GeForce 8500GT作为NVIDIA DX10入门级产品中“最高端”的产品,规格同样是五花八门,甚至还有厂商使用了具备32个流处理器的G86核心来做GeForce 8500GT,而且核心频率也高达600MHz——这分明就是GeForce 8600GT的规格了,可见NVIDIA自己对于这些产品的控制也是很松的,但这在很大程度上却让消费者更加迷惘:为什么我买的GeForce 8600GT比别人的GeForce 8500GT还慢!
重新解释一下GeForce 8500GT的默认定位:它采用G86-300核心,具备16个流处理器,8个光栅单元(基本上等效于传统的4条渲染流水线),按照NVIDIA推荐的显卡规格,它的性能应该在GeForce 8600GT以下、GeForce 8400GS以上。
AMD组
Radeon HD3870
核心代号:RV670
核心频率:776MHz
显存位宽:256bit
显存容量:512MB

AMD的Radeon HD3870在千元级显卡市场中的性价比是非常不错的,同时它也是采用单个RV670芯片中最高端的一款。RV670 VPU具备了320个流处理器、16个光栅单元,单从流处理器数量来说,RV670的确比G92要高出许多,但是不能简单地这么认为RV670就一定要比G92强很多,毕竟它们处理数据的模式不一样,在后面的测试中我们可以仔细比较一下两个不同架构的显示核心在性能上的区别。
Radeon HD3870在市场中销售的版本全部配备了GDDR4显存,工作频率达到了2.16GHz(现在也有高频版的GeForce 9600GT使用了高达2.4GHz的GDDR3),虽然从开始的定位来看,Radeon HD3870算是AMD比较高端的产品,不过现在价格一再下调,已经成为千元级显卡中性价比较高之选了。
Radeon HD3650
核心代号:RV635
核心频率:722MHz
显存位宽:128bit
显存容量:256MB

本次测试我们没有选择Radeon HD3850来测试,因为Radeon HD3850与Radeon HD3
870仅有工作频率和显存类型上的区别,VPU部分是完全相同的,在统一频率的情况下,Radeon HD3870与Radeon HD3850是完全相同的东西,所以中低端产品我们直接选择了Radeon HD3650作为代表。
Radeon HD3650采用的是RV635核心,具备120个流处理器和4个光栅单元,核心频率高达722MHz——AMD的Radeon HD3000系列在核心频率上一直都有一定优势。显存部分搭配的是128bit/256MB的GDDR3,频率达到了1.6GHz。按照性能定位,Radeon HD3650应该是处于GeForce 8600GT与GeForce 8500GT之间,而价格却与GeForce 8500GT持平,所以在中低端产品中性价比还算不错。
Radeon HD3450
核心代号:RV620
核心频率:600MHz
显存位宽:64bit
显存容量:256MB

这款Radeon HD3450可以说是Radeon HD3000系列中的小兄弟,主要针对高清视频用户和入门级用户,3D性能已经不是它的卖点。
Radeon HD3450采用RV620核心,具备40个流处理器单元以及4个光栅单元,由于3D性能并不是它的侧重点,所以只搭配了64bit的DDR2显存。从定位来看,Radeon HD3450和GeForce 8400GS定位更为接近。当然,这里我们只是用它的核心来与同系的产品进行一个性能对比,明确它的性能定位而已,并不是说它的性能很低而不值得购买——毕竟它的定位是高清用户。
公平决斗!N与A的大混战
本次我们除了统一频率进行测试外,也提供了默认频率下的测试成绩,所以大家除了可以了解同样频率下不同显卡架构带来的性能差异外,也可以了解实际显卡产品的性能定位,同时也可以观察工作频率对不同显卡性能的影响程度。
测试软件方面,除了标准的3DMark系列外,我们也引入了《孤岛危机》与《失落的星球》这两款DX10游戏,测试结果更贴近实际情况。
显卡的频率调节方面,NVIDIA显卡我们使用了Rivatuner 2.09,AMD显卡则使用自带的催化剂控制中心。
测试平台
处理器:Core2 Quad Q6600
内存:DDR3 1333 1GB×2
主板:华硕P5E3 Deluxe
硬盘:希捷酷鱼7200.11 1TB(32MB缓存)
显示器:BenQ G2400W
光驱:BenQ BR1000蓝光刻录机
电源:航嘉磐石800
操作环境:Windows Vista32 + SP1
ForceWare175.63
催化剂8.4(HotFix)
GeForce 9800GTX核心默认频率为675MHz,Shader频率为1688MHz,降低到500MHz/1200MHz后,性能下降幅度明显,大约有25%的性能降低。但在这个统一频率下,它依然保持性能第一的水平,这里最能看出流处理器、显存位宽以及显存容量带来的差距的比较是GeForce 9800GTX对GeForce 9600GSO——因为它们都是G92核心,架构是相同的。
也就是说,64bit的显存位宽/128MB的显存容量/32个流处理器的差距最终使得同频率下的GeForce 9800GTX要比GeForce 9600GSO快7%~32%。
再来看看GeForce 9800GTX与GeForce 9600GT的对比,128bit的显存位宽/64个流处理器的差距,带来了14%~28%的差距,这里大家也看出来了,GeForce 9600GT 512MB版与GeForce 9600GSO 384MB版在同频的情况下性能是基本相当的,但在默认频率下,GeForce 9600GT依靠极高的频率,性能表现在GeForce 9600GSO之上。这意味着我们如果购买了超频能力不错的GeForce 9600GSO的话,将其频率提升到GeForce 9600GT的水平,性能会比GeForce 9600GT更好。
GeForce 8600GT与GeForce 8500GT的核心架构差别比较大,同频测试下的结果差距也十分明显,大约在34%~61%之间(由于绝对幅度较小,所以相对差距较大),这与GeForce 8600GT比GeForce 8500GT流处理器数量多一倍有直接关系。
AMD方面,同频下的Radeon HD3870比Radeon HD3650性能高出80%~133%,这是200个流处理器单元、12个光栅单元以及128bit的显存位宽、256MB的显存容量带来的差距,定位差距非常明显。Radeon HD3650与Radeon HD3450之间相差80个流处理器单元、64bit显存位宽,如此就带来了130%~150%的性能差距。可以说AMD这几款产品的定位拉得很开,而NVIDIA方面千元级产品中,架构有差异的产品之间依靠高频率来弥补,反而定位比较交叉。
从功耗方面来看,NVIDIA这边GeForce 9600GT效能表现出众,同频情况下,虽然GeForce 9600GSO性能与之相仿,但功耗却要高出不少。AMD方面,Radeon HD3650的效能表现不尽如人意,功耗相对GeForce 8600GT较高。NVIDIA和AMD两边的入门级显卡功耗都十分低,尤其是Radeon HD3450,的确是用来做HTPC的好选择。

工程师总结
硬件评测周刊工程师 王诚
根据统一频率下的测试结果,我们对这几款DX10显卡的定位按得分比例给出了一个星级评分(基于3DMark Vantage得分,按照最高成绩与最低成绩的比例制定星级数量),这个评分基本上能够代表该GPU/VPU的实际市场定位。
将市场中销售的DX10显卡都放到同一频率水平上来进行对比,这个想法也是来自读者的提问与建议,我们收到很多读者的来电,询问购买显卡的相关问题时都提出目前市场中的GPU/VPU产品那么多,它们的性能到底是怎么划分档次的?而且它们的频率差别也很大,到底怎么去判断一款显卡的性能定位?而将各档次显卡的工作频率都调节到相同水平,这一问题就很容易判断了,大家可以从我们的测试中轻易地分辨出各款显卡的定位情况。

如何利用我们的测试结果去选购显卡?
前面的表格中已经列出了各款显卡的性能定位,那么在具体的购买中怎么看待这个定位呢?我们以购买中低端游戏显卡为例,从这个表格中可以看到,GeForce 8600GT与Radeon HD3650是比较合适的选择,但在购买的时候商家极力推荐一款采用GDDR3的高频版GeForce 8500GT(或者是号称硬跳线变GeForce 8600GT的GeForce 8400GS),价格相差不大,那么该怎么选呢?我们从表中的定位可以看到,同频下的GeForce 8600GT要比GeForce 8500GT更强,实际游戏中最高差距可达61%,即便这款GeForce 8500GT频率比GeForce 8600GT高很多,但是我们知道GeForce 8600GT同样可以达到这么高的频率!而且现在GDDR3版的GeForce 8600GT的价格也不高,我们完全没必要再考虑所谓的高频版GeForce 8500GT之类的鸡肋产品。
再以GeForce 9600GT与GeForce 9600GSO为例,两者的价格差不多,都有昂贵的超频版,也有公版的普通产品。从我们的表格上来看,两者同频下的表现非常接近(GeForce 9600GSO在游戏中的性能略高),也就是说,同样价格的情况下,谁的频率高、谁的显存大谁就占优势,那么该买谁也非常清楚了。
总的来说,只要认清了这些市售DX10显卡的性能定位档次,那么在实际选购的时候,心里就能有谱了,该买哪个不该买哪个,JS再也难不倒你。