至尊强者:史上最强GeForce 8800GTX SLI

抢鲜体验

2006年11月8日NVIDIA正式发布G80系列图形加速卡,继续站在显卡性能的巅峰。从GeForce系列诞生以来,现在已经到了第8代产品,无论是在性能还是在架构上都有了很大的变化,作为游戏玩家和硬件发烧友,我们和大家一起见证了3D加速卡进步的每一个里程碑,而本次G80发布也继续演绎着游戏显卡的进化史,下面我们就来看看XFX GeForce 8800 GTX/GTS的表现。

为DirectX10而生的G80

45-d13-2.jpg
左为GeForce 8800GTX 右为GeForce 8800GTS

作为NVIDIA GeForce系列的第8代产品,代号G80的GeForce 8800系列拥有一系列的新技术和新架构设计。G80采用80nm工艺制造,具备6.81亿个晶体管(大约是Athlon64 3000+的10倍),其中GeForce 8800GTX核心频率为575MHz,使用384bit位宽的GDDR3显存,容量为768MB,显存频率为900MHz(等效1.8GHz),采用双6Pin接口供电;GeForce 8800GTS核心频率为500MHz,显存则采用320bit、640MB的GDDR3,频率为800MHz(等效1.6GHz),采用单个6Pin接口供电。架构方面,GeForce 8800GTX具备128个通用Shader单元,而GeForce 8800GTS则具备96个通用Shader单元,这里的通用架构我们将在后面进行介绍。下面我们对GeForce 8800系列采用的一些主要的新特性、新技术进行简单的说明。

通用、大规模并行着色设计

45-d13-3.jpg
G80架构图

G80采用了通用着色架构(也称“统一渲染架构(Unified Shader)”),例如GeForce 8800GTX就具备128个通用数据流处理器,这些并行处理的、独立的数据流处理器工作在1.35GHz的频率下,可以完成像素、顶点、几何、物理特效的运算,也就是说,和以前的GeForce 7系列不同的是,GeForce 8800GTX再没有明确的像素、顶点单元,所有的数据流处理器都可以完成所有种类的运算,这样灵活的设计对于侧重不同的游戏更能发挥出全部的性能。(更详细的介绍可以参考第44期硬件评测周刊“技术空间”)

DirectX10原生设计

GeForce 8800系列将完全支持DirectX10的全部特效,用NVIDIA发布的原话来说:“G80包括了DirectX10中定义的全部硬件功能,完全支持DirectX10中的通用着色指令集,包括Shader Model4.0。”这里还需要提出的是,G80也支持DirectX10中新增加的几何着色技术,可以在一定程度上减少CPU的运算负担。

Lumenex引擎

使用在GeForce 8800系列中的Lumenex引擎是一项增强图像质量的技术,通过这项技术,GeForce 8800GTX可以实现全屏幕范围的16×多重采样抗锯齿,而此时的性能则与4×多重采样抗锯齿相当,换句话说就是开启16×多重采样抗锯齿时的性能下降幅度较小。全新的抗锯齿技术将同时利用 Coverage samples 及 Geometry Sample 采样,称为 Coverage Sample Anti-aliasing (CSAA),通过此项技术,G80就可以实现8×,甚至是16×的抗锯齿功能。另外,Lumenex引擎还带来了128位精度的HDR特效,HDR+AA将不再是ATI的专有。Lumenex引擎还将G80的色彩输出从16.7M提升到了10亿以上,G80的色彩表现将更加真实。

Quantum Effects,基于GPU的物理运算

Quantum Effects是应用在GeForce 8800系列中的一项新技术,通过它可以让GeForce 8800系列GPU完成一些物理运算,在游戏中实现更多更真实的烟火、爆炸等效果。以前这些运算都会交给CPU来运算,现在CPU资源可以解放出来进行更多的AI运算等等,让游戏更加流畅和具有趣味性,而以后我们可以玩到很多这样的DirectX10游戏。

Extreme High Definition Gameing(XHD)超高分辨率游戏

GeForce 8800GTX支持最高2560×1600的宽屏分辨率(16∶10),以后越来越多的游戏会支持宽屏分辨率,而随着大屏幕显示器的不断普及,使用更高分辨率来获得更好的游戏画面或者是高清视频享受是玩家所追求的,因此GeForce 8800GTX提供了对超高分辨率的支持来满足发烧级玩家的苛刻需求。

在G80横空出世之时,NVIDIA在主板芯片组市场中也亮出了新的王牌:nForce 680 SLI,本次我们收到的测试样品是支持Intel处理器的版本,全名则是nForce 680i SLI。由于它支持双PCI-E ×16接口以及四核心处理器,所以成为了GeForce 8800GTX SLI的首选平台。

nForce 680i SLI介绍

45-d13-4.jpg
映泰 nForce 680i SLI主板

在推出nForce 500系列以后,NVIDIA现在继续推出了更高规格的nForce 600系列。其中nForce 680i SLI将接替高端的nForce 590 SLI IE,其它还有两款nForce 650i SLI和nForce 650i Ultra则定位低端一些。

相对于nForce 500系列,nForce 680i SLI正式提供了对1.3GHz FSB的支持,同时也支持FSB、内存独立调节频率的功能,更方便超频。另一方面,它还提供了SLI-Ready Memory技术,在内存支持的前提下(内存支持EPP),可以由主板根据性能需要对内存的延时、频率进行自动调节,寻找延时与频率的最佳分割点以保证在稳定的情况下获得最好的性能,该项技术要求内存支持才可以实现,比如我们本次测试使用的海盗旗XMS2-9136内存就能够支持,目前nForce 680i SLI最高可以正式支持1.2GHz的DDR2内存。另外,nForce 680i SLI的最大特色就是具备46个PCI-E通道,因此它可以提供三条PCI-E ×16插槽(其中一条为8通道),以后实现三显卡SLI(其中一块负责物理运算)也并非不可能的事。nForce 680i SLI还支持双千兆网卡并行处理的网卡“SLI”技术,叫做Dual Net技术,其它方面,nForce 680i SLI提供6个SATA2接口和一个PATA接口,符合主流平台的水平。

测试篇

测试平台

处理器:Intel Core2 Extreme QX6700(2.66GHz 超频至 2.93GHz)

主板:映泰 nForce 680i SLI

内存:海盗旗 XMS2 DDR2 1142 1GB × 2

电源:Thermaltake ThoughPower 750W

硬盘:希捷 7200.10 250GB

显示器:BenQ VL3735 37英寸液晶电视

显卡:XFX GeForce 8800GTX × 2

XFX GeForce 8800GTS

XFX GeForce 7900GTX

软件环境:Windows XP Professional + SP2

DirectX9.0c

ForceWare96.94

既然G80号称是目前最强的游戏显卡,那么我们自然要用最强大的平台来支持它。处理器方面,当然是选用具备四核心的Core2 Extreme QX6700,它的强大性能请参考今年第44期《电脑报》硬件评测周刊,这块工程版的QX6700并没有锁定倍频,我们在风冷的情况下直接将它的倍频调节为11,此时频率为2.93GHz,再调高则出现不稳定的现象,因此我们决定在2.93GHz的频率下进行测试。主板方面,我们选择了NVIDIA最新推出的nForce 680i SLI,用来搭配QX6700和XFX GeForce 8800GTX做SLI再合适不过,毕竟它是可以支持双PCI-E ×16插槽的,让GeForce 8800GTX SLI发挥最大性能非它莫属。由于我们需要考查G80在高分辨率下的性能表现,因此我们首次采用了37英寸的液晶电视来代替显示器,这款37英寸的液晶电视可以在使用HDMI接口的情况下完美支持1920×1080的分辨率,在极限画质条件下的游戏画面可用震撼效果来形容。G80对电源的要求也是极高的,根据NVIDIA的官方资料,单卡GeForce 8800GTX需要450W电源,双卡SLI则需要800W的电源。这次测试中,我们选用的Thermaltake ThoughPower 750W。如果发烧级玩家想组建GeForce 8800 GTX SLI,推荐使用1000W以上的电源才能保证系统长时间的正常运行。

本次测试使用的配置可以说是目前最强大的游戏平台,相信DIY玩家们已经迫不及待地要想看看在这样的“终极平台”上,到底有什么样的游戏表现了,那么我们现在就开始吧。

45-d13-b1.jpg

8800GTX单卡轻松突破3DMark06万分

GeForce 8800GTX的性能果然十分强悍,在我们的“终极平台”上,仅仅是GeForce 8800GTX单卡就在3DMark06中轻松突破10000分,达到了11965,3DMark05得分也达到了16646分之高,这个水平几乎就是GeForce 7900GTX SLI系统的表现了。3DMark05/06都可以支持1920×1080的高清宽屏分辨率,我们将全屏抗锯齿设置为4×,各向异性过滤设置为16×,同时将分辨率设置到1920×1080,在这样“恐怖”的设置下,GeForce 8800GTX依然在3DMark05中得到了12151的高分,在3DMark06中也有7520分,表现相当强悍。GeForce 8800GTS在规格上相对GeForce 8800GTX要低一些,自然性能上有一定差距。在同样平台上,GeForce 8800GTX的3DMark06标准得分大约高出GeForce 8800GTS 25%,高分辨率下大约高出31%,高分辨率下GeForce 8800GTX的优势更高一些,这与它的显存位宽达到384bit,高于GeForce 8800GTS的320bit有一定关系,更高的显存位宽对于显卡在高分辨率下的性能更有帮助。上一代的GeForce 7900GTX则显得有些力不从心了,虽然在3DMark05的标准测试中得分也能达到12000以上,但在高分辨率下性能就下降非常大了。

用双GeForce 8800GTX组建的SLI平台可以说是目前最强的游戏显卡系统,两块GeForce 8800GTX轻松地在3DMark06的标准测试中得到15246的高分,相对单卡提升了27%,在高分辨率下提升了66%,可见在低分辨率下,双GeForce 8800GTX的性能已经被QX6700和内存系统所限制了——你没看错,的确是QX6700和双通道DDR2 1066成为了瓶颈。而在高分辨率下,显卡的负载增大,单卡和双卡的性能差距更能够凸显出来。在这里还需要提一句,要在1920×1080分辨率下打开4× FSAA和16×AF来进行HDR测试的话,没有足够多的显存是无法实现的,至少512MB显存是不够的,这也是为什么GeForce 8800GTX和GeForce 8800GTS都搭配了768MB/640MB显存的原因。

驱动程序有待改进

我们来看看3DMark06中GeForce 8800GTX的子项测试成绩。首先是材质填充部分,无论是单材质填充还是多材质填充速度,GeForce 8800GTX SLI都要比GeForce 8800GTX单卡大约快一倍,这与理论值非常接近;HDR测试部分,结果也是如此,GeForce 8800GTX双卡基本上也比单卡快上一倍,这也是3DMark在这方面测试的优势,它可以反映在理想环境下显卡的理论成绩,结果还是比较准确的。GeForce 7900GTX在子项上的得分比较奇怪,甚至某些项目还超过了GeForce 8800GTX/GTS,我们开始猜测可能是G80和新驱动程序搭配还不够完美的结果,不过经过反复验证发现,GeForce 7900GTX在3DMark06的子项测试中,1920×1080高分辨率下,开启或者关闭抗锯齿和各向异性过滤已经对单项测试没有任何影响,所以这里得到的是没有开启抗锯齿和各向异性过滤时的性能得分,这也许是驱动程序的问题。

实测8800GTX应对极飞10

正好在G80发布之前,EA的赛车系列大作《极品飞车10:卡本峡谷》正式上市了,游戏本身画面非常绚丽,同时对显卡的要求也可以用“变态”来形容,那么我们就让G80来对付它看看。

《极品飞车10:卡本峡谷》没有提供超过1024×768@32bit以上的分辨率,但我们还是可以开启4×FSAA和16×AF来提高画质。在未开启抗锯齿效果的情况下,GeForce 8800GTX的游戏速度在64fps到123fps之间徘徊,平均大约有85fps的样子,游戏速度当然是十分流畅了,不过想想看,QX6700 + GeForce 8800GTX也不过就平均85fps,那主流配置……想流畅只有降低特效了。开启抗锯齿之后,GeForce 8800GTX的速度在56fps到95fps范围内,平均75fps左右,速度有一定的降低。当然GeForce 8800GTX SLI就没有什么问题了,不开抗锯齿大约有86fps左右,开启之后大约有80fps左右,相对单卡有微弱的提升。

45-d13-b2.jpg

再来看看经典的Quake4测试,在1024×768@32bit的标准测试中,GeForce 8800GTX达到了229fps的流畅速度,双卡则为230fps,几乎没有提升,看来Quake4在新显卡的SLI系统中并不能获得多少速度提升。值得一提的是,我们在Quake4的高分辨率测试中使用了 8×AA,这也是G80强大的像素处理能力表现的地方。在1600×1200@32bit的高画质测试中,GeForce 8800GTX的速度降到了118fps,大约有48%的降幅,可见8×AA对于显卡的资源占用还是很大的,在高画质模式下,GeForce 7900GTX得分一下从200fps以上跌落到38fps,降低幅度远远大于GeForce 8800GTX。

工程师点评

G80的强悍出击的确让目前其它所有的游戏显卡都甘拜下风。GeForce 8800GTX单卡3DMark06轻松破万分这样的成绩几乎相当于两块GeForce 7900GTX SLI的表现,而在高分辨率下,尽量避免CPU和内存带来的瓶颈之后,GeForce 8800GTX超过上一代显卡的幅度更大,而组建SLI系统之后,GeForce 8800GTX强大的处理能力让目前所有显卡(不含极端超频情况)都望尘莫及。从规格来看,GeForce 8800GTX具备的384bit显存位宽和128个通用数据流处理器的设计已经远远超过上一代显卡的水平,这样的设计相对于已经沿用了很久的256bit位宽以及分类着色引擎来说算得上是一次革命性的进步,是3D加速卡发展史上一个里程碑,同时它带来的性能提升也是非常明显的。此外,G80对DirectX10的完全支持也意味着它在以后的应用中更加“多能”,比如我们可以让两块G80进行图形方面的运算而另一块G80来实现物理运算,这样的话CPU就有更多的空闲来处理AI等数据,游戏体验也更加精彩。不过,值得一提的是,GeForce 8800GTX的功耗是相当惊人的,根据相关测试,满载的GeForce 8800GTX单卡功耗在330W左右,即便是闲置的时候也在200W以上,相当夸张了,难怪目前买GeForce 8800GTX双卡套装会赠送800W电源一个……估计只有发烧友才不会在乎它巨大的功耗了。

根据NVIDIA的一贯做法,在发布最高端的产品之后,会推出精简版的系列产品,采用同样的架构,在执行单元方面有所精简,价格和功耗也大大降低,逐渐普及到主流市场,这样就算是主流的用户,也可以享受到G80崭新的设计。

对于同样新出台的nForce 680i SLI,用它作为NVIDIA新一代的Intel平台高端领跑产品是非常合适的,就目前的测试来看,nForce 680i SLI是组建SLI系统的最高选择,而且超频性能也相当出众,即便是Intel自己的i975X和P965,也将受到nForce 600系列的强力冲击——特别是在DIY市场。当然,对于主流的用户来说,价格更平易近人的nForce 650i Ultra或许更值得选择。

G80、nForce 680i SLI,NVIDIA已经发布了不少顶尖级产品了,而ATI和AMD则暂时还没有特别惊人的动作出现,我们强烈期待着“AA” 的应战,及时推出顶级产品,这样的战斗才更加有意义。