杀手代号“开普勒” NVIDIA GeForce GTX 680显卡全面评测

主题策划

12-b4-6.jpg

原本,NVIDIA的下一代显卡开普勒可能要拖到今年下半年才发布,不过今年1月9日AMD的下一代显卡南方群岛来势汹汹,首款旗舰级显卡Radeon HD 7970一发布就扭转了长期以来的劣势,革新的架构表现出了非常强劲的性能,逼迫NVIDIA不得不加快步伐,以应对AMD的强大攻势。在这种情况下,原计划可能是下半年发布的开普勒就提前登场了,和AMD一样,NVIDIA最先发布的也是旗舰级的高端显卡——GeForce GTX 680。评测实验室在第一时间拿到了一块GeForce GTX 680,下面我们就来看看代号为“开普勒”的GeForce GTX 680能带给我们多少惊喜。

开普勒一览

NVIDIA的开普勒系列显卡在2011年也曾经多次有消息传出,不过一直是只闻其声不见其人,由于新显卡采用了全新的28nm制程,而台积电在新工艺方面还存在着不少问题,产量和良品率都上不去,因此一拖再拖,直到2012年1月AMD的Radeon HD 7970正式发布的时候开普勒都还没有确定的消息。

开普勒系列采用了和费米系列完全不同的全新架构,核心与SHADER不再分频,更加入了独特的GPU Boost技术以提升性能,CUDA Core数量也从512个提升到1536个……通过这种全新的架构设计,开普勒系列显卡不仅显示性能有大幅度的提升,而且其功耗也有明显下降,通用计算的性能也有一定程度的提升。同时,为了扭转长期以来在多屏输出方面的弱势,抗衡AMD Eyefinity 2.0(第二代多屏输出技术)并增强对3D立体显示的支持,开普勒也同时引入了一系列新功能。

编注:关于开普勒新技术的详细介绍请参见本期E01版。

细看GeForce GTX 680

12-b4-8.jpg
双SLI桥接口支持多卡互联
12-b4-9.jpg
双6Pin供电接口就能够满足GeForce GTX 680的供电需求,看来其195W的TDP可信
12-b4-10.jpg
背部多达19颗螺丝固定,其散热器的重量也不小
12-b4-13.jpg
HY的H5GQ2H24MFR-R0C显存,设计频率为6000MHz
12-b4-12.jpg
8颗256MB的显存围绕在核心周围,显卡的后半截是数字供电模块
12-b4-11.jpg
整个散热器也相当大,当然散热能力也不错
12-b4-14.jpg
核心上写着“NVIDIA ZA TAIWAN 1202A2 N6G314.NSA”字样
12-b4-7.jpg
两个DVI接口、一个HDMI接口和一个DisplayPort接口支持最多四屏输出
12-b4-2.jpg
12-b4-3.jpg
开普勒的核心架构及核心照片

新技术带来性能飞跃

作为开普勒系列显卡的单卡旗舰,在Radeon HD 7970的压力下GeForce GTX 680不得不担任先锋队,否则其新架构和新制程的优势将完全无法完美地体现出来,有Radeon HD 7970在前,如果不能战而胜之,一定有很多用户会对开普勒相当失望。

相对于NVIDIA上一代的旗舰级显卡GeForce GTX 580,GeForce GTX 680核心与SHADER不再分频, SHADER频率和核心频率保持一致,为1006MHz,略低于GeForce GTX 580 1544MHz的SHADER频率。为了弥补SHADER频率降低带来的副作用,GeForce GTX 680的CUDA Core数量从512个提升到1536个,同时架构也有一些变化。在GeForce GTX 680核心中有4个GPC(图形处理簇),每个GPC里有两组SMX,每个SMX拥有192个CUDA Core,而GPU内的控制单元相对GTX580简化了不少,这样一来显卡的功耗也得到明显的降低。与此同时GeForce GTX680的光栅单元减少到32个,而纹理单元增加到128个,显存位宽从384bit变成了256bit,但显存频率提升到6008MHz,显存带宽与GeForce GTX 580相当。

通过架构的革新和规格的优化,理论上来说GeForce GTX 680的3D性能将比上一代的旗舰级显卡GeForce GTX 580高出一大截。同时,由于采用了更先进的28nm制程,不仅频率可以设定得更高,而且尽管CUDA Core数量提升到了1536个,纹理单元也翻倍成了128个,但简化了GPU内存控制器的设计,其功耗也应该有明显的下降。

另外,GeForce GTX 680还采用了智能频率调节技术:GPU Boost,和Intel的高端处理器睿频技术相似,GPU Boost能够在低负载的情况下,降低GPU频率以减少功耗,但与以往不同的是GPU Boost还能在需要的时候,提升GPU频率以提升性能。而且,GPU Boost是完全自动执行的,无法关闭,在实际游戏中它会根据负载和显卡的功耗状态自动地选择超频幅度,以达到提升性能和节省电力的目的。同时,NVIDIA还在开普勒中加入了自适应垂直同步技术和TXAA抗锯齿技术,让使用开普勒显卡的电脑在游戏中的画面体验更好,同时卡顿也更小,游戏帧数变化更加平滑。

通过对GeForce GTX 680的规格和新特性的分析,我们可以看到,全新的架构设计和技术特性赋予了GeForce GTX 680强大的性能和丰富的功能。那么在实际的性能测试中,GeForce GTX 680是否会有同样出色的表现呢?

12-b4-4.jpg
GeForce GTX 680 GPU-Z截图
12-b4-5.jpg
NVIDIA给GeForce GTX 680加入了新技术GPU Boost和自适应垂直同步

常规性能实测

测试平台

■处理器:Intel Core i7 3960X

■主板:Intel DX79SI

■显卡:GeForce GTX 680

迪兰恒进Radeon HD 7970(3GB)

索泰GeForce GTX 580(3GB)

■内存:宇瞻DDR3 1600 2GB×4

■硬盘:希捷7200.12 1TB

■显示器:明基XL2410T

■电源:长城巨龙1250

■操作系统:Windows7 64bit 旗舰版

■驱动程序:AMD 催化剂11.12

NVIDIA Forceware 300.99

■环境温度:18℃

我们收到的这款GeForce GTX 680为NVIDIA官方公版产品,为了更好地说明GeForce GTX 680的性能表现,我们加入了AMD的旗舰级单卡Radeon HD 7970和NVIDIA的GeForce GTX 580,进行对比测试。

由于新架构的GeForce GTX 680不仅提高了3D性能表现,而且增加了CUDA Core数量,因此我们也将测试分为两个部分:使用3DMark 11、DX11的《天堂2.5》、《失落星球2》、《战地3》、《石巨人》,DX10的《生化危机5》和DX9的《街霸4》来测试其在3D游戏方面的性能表现,使用SiSoftware Sandra 2011的GPGPU着色和GPGPU加密测试来测试其通用计算能力,同时也对比各参测显卡的功耗和满载时的核心温度。通过对比这三款显卡的性能,让大家能够对GeForce GTX 680的性能有一个比较全面的了解。

游戏性能全面领先

在3DMark 11测试中,全新的架构和更多CUDA Core发挥出了强大的性能,不仅比上一代的GeForce GTX 580高出34%以上,就算是跟Radeon HD 7970相比也有超过19%的性能优势。而且我们可以看到,新架构的优势更在于大负荷运算下的性能,相对于GeForce GTX 580,GeForce GTX 680的3DMark11 X模式领先幅度比P模式的领先幅度更大。

从游戏测试结果来看,GeForce GTX 680的表现堪称完美,无论在DX11游戏还是在DX10、DX9游戏中,增加的纹理单元和CUDA Core都发挥了不小的作用,2GB高频大显存和256bit的显存位宽也表现出了应有的性能。

在《天堂2.5》的性能测试中,GeForce GTX 680的表现超越GeForce GTX 580 50%以上,对Radeon HD 7970也有16%的性能优势。在《石巨人》的性能测试中,GeForce GTX 680的性能表现同样出色,不仅超过GeForce GTX 580 28.9%,更超过Radeon HD 7970 42.7%。在《失落星球2》这种对NVIDIA显卡进行过优化的游戏的性能测试中,GeForce GTX 680的性能高出GeForce GTX 580 11.5%,但超出Radeon HD 7970 40.9%。在《战地3》的性能测试中,GeForce GTX 680的表现超过GeForce GTX 580 25.4%,不过对于同样是新一代显卡的Radeon HD 7970,领先幅度就没有在《失落星球2》中那么大了,只有10.4%。可以说通过更新架构,增加CUDA单元和纹理单元,在高分辨以及8×AA环境下,GeForce GTX 680面对任何大型DX11游戏都没有问题。

在DX10游戏中,GeForce GTX 680的表现同样不俗,无论是和GeForce GTX 580相比还是和Radeon HD 7970相比,都有一定的优势,不过优势并不明显。而在DX9游戏中,由于游戏对显卡的负荷较小,GeForce GTX 680的优势没有完全表现出来,和GeForce GTX 580以及Radeon HD 7970打了个平手。

12-b4-15.jpg
对比测试的Radeon HD 7970
12-b4-16.jpg
对比测试的GeForce GTX 580

通用计算不敌Radeon HD 7970

通用计算能力一直是NVIDIA显卡的强项,不过AMD给南方群岛系列显卡设计了全新的架构大幅提升了其通用计算能力,因此GeForce GTX 680的原本应该有的性能优势不复存在。从测试结果我们可以看出,GeForce GTX 680的通用计算能力虽然相比GeForce GTX 580来说提升不少,但相对于强化了通用计算的Radeon HD 7970来说就没有任何胜算了。

新制程新架构降低功耗

在功耗和发热方面,性能非常出色的GeForce GTX 680能耗确实有了明显改善,虽然集成了35.4亿个晶体管,搭配了2GB的显存,其满载功耗也不过306W,相对于GeForce GTX 580来说,在性能大幅提升的情况下,功耗并没有任何变化。而相对于Radeon HD 7970来说,其满载功耗低了52W,算是非常不错的成绩了,我们可以看出28nm制程和核心架构给GeForce GTX 680带来的巨大优势。如果还是40nm制程的话,估计其功耗会超过360W。

同时,新制程和新工艺也带来了待机功耗的下降,虽然相对于Radeon HD 7970的核心零功耗技术而言,其待机功耗还不算低,不过和GeForce GTX 580相比,其待机功耗的下降还是非常明显的,我们可以认为GPU Boost在控制功耗方面还是非常成功的。

而且在如此高的功耗下,GeForce GTX 680的核心温度控制得相当好,满载温度也不过81℃,低于Radeon HD 7970的84℃,只是高于采用了非公版多热管双风扇设计的索泰GeForce GTX 580。

GPU Boost及新制程带来出色超频

由于GeForce GTX 680采用了GPU Boost技术,即便在标准频率下进行测试也会提升其核心频率,也就是说GeForce GTX 680相当于是默认超频的。虽然NVIDIA宣称自动超频的平均频率为1058MHz,但经过我们测试其默认超频频率为1106MHz。而且,在无法关闭GPU Boost的状态下,即便我们手动提高了核心和显卡的频率,它依然会在手动超频的基础上继续自动超频。不过此时,由于TDP的限制,其自动超频的幅度有所下降,为此我们在手动超频的基础上又进一步提升了TDP上限至132%,看看GeForce GTX 680会有什么样的表现。另外,为了验证GPU Boost的功能,我们还将TDP上限降低为80%,看看GPU Boost是否真的能起作用。

由于GeForce GTX 680采用了最新的28nm制程,其发热量能够得到非常好的控制,而且电气性能更高,理论上来说可以承受更高的频率。我们尝试将核心频率和显存频率都拉高:最终我们测定可以稳定运行的频率为1156MHz/6508MHz(加入GPU Boost自动超频后实际的最高点约为1258MHz/6508MHz),进入各种游戏都没有出现花屏或游戏运行不正常的情况,各种测试都能够成功完成,我们认为GeForce GTX 680是能够正常运行在1258MHz(核心)/6508MHz(显存)状态下的。

从测试成绩来看,在3DMark11和所有游戏中,手动超频后的GeForce GTX 680的性能领先幅度在0.7%~13.5%:在DX11的《失落星球2》中,超频后的GeForce GTX 680的性能领先幅度只有0.7%,在《战地3》中,超频后的GeForce GTX 680的性能领先幅度提升到13.5%,很显然由于TDP的限制,GPU Boost并没有发挥出完全的优势。对于GeForce GTX 680来说,超频而不超TDP,性能提升的幅度并不大。

在手动超频又提升TDP上限的情况下,GeForce GTX 680的表现就更好一些了,我们可以看到在3DMark11和所有游戏中,双向超频后的GeForce GTX 680的性能领先幅度在3.3%~13.5%:《失落星球2》超频后性能领先幅度提高到7%,这明显是由于TDP上限提高,GPU Boost起的作用更大带来的性能提升。而在DX10的《生化危机5》和DX9的《街霸4》中,由于游戏负荷较小,本来就不能完全突破TDP上限,因此相对于只超频率,双向超频带来的性能提升微乎其微。

那么,如果只是改变TDP上限,GeForce GTX 680的表现又会是怎样的呢?我们尝试将TDP上限提升到132%和降低到80%,效果也同样明显。对于只提升TDP上限而言,由于核心频率提升的幅度是有限的,因此我们可以看到只提升TDP上限,GeForce GTX 680性能提升的幅度并不太大,只有0.3%~12.8%,《失落星球2》和《街霸4》甚至有略微的下降(不过幅度低于3%,可以认为是测试误差)。而降低TDP上限带来的性能降低更加明显,虽然降低的幅度为1.4%~23%,但整机功耗的下降幅度也有18%,可以说TDP上限确实对显卡性能有非常大的影响。

而且我们可以看到,由于测试功耗的Furmark对显卡的负载非常大,手动超频以后,未提高TDP上限的状态下,由于频率过高引起了TDP保护,实际满载功耗竟然比未超频状态下还低一些。

12-b4-17.jpg
GeForce GTX 680最高可以稳定在1156MHz(核心)/6505MHz(显存)状态

最强单卡花落NVIDIA

GeForce GTX 680的全新架构、新技术和设计给它带来了非常出色的性能表现,尤其是GPU Boost带来的性能提升非常巨大,在默认频率相近的状态下,由于GPU Boost的存在GeForce GTX 680的性能全面领先于Radeon HD 7970。同时,28nm的制程和优化的结构也极大地缓解了因为晶体管数量膨胀带来的高发热,让GeForce GTX 680的功耗表现非常抢眼,而且也带来了非常优秀的超频能力。

从具体测试成绩来看,GeForce GTX 680的性能非常不错,在所有游戏测试中都能够领先Radeon HD 7970,面对上一代的旗舰级显卡GeForce GTX 580也拥有非常出色的性能优势。从性能上说,配备GeForce GTX 680显卡的系统在高分辨以及8×AA环境下已经能够非常流畅地运行DX11游戏,即便是在同样的分辨率和AA条件下应付3D Vision游戏都不会有太大问题。

在通用计算方面,GeForce GTX 680的性能也有一定程度的提升,不过由于AMD Radeon HD 7970针对通用计算进行了大幅度的优化,因此在这部分的测试中GeForce GTX 680完全不是Radeon HD 7970的对手。

从整体性能来看,GeForce GTX 680推出之后,最强单卡的名号就不再属于Radeon HD 7970了,不过其价格也相对较高,对于550美元的预售价格来说,我认为GeForce GTX 680的表现虽然比较出色,但还没有达到完美的地步。不过,GeForce GTX 680的推出必将给Radeon HD 7970造成巨大的压力,也许AMD会推出更高频率的Radeon HD 7970,或者是将售价为549美元的Radeon HD 7970价格下拉到499美元,这样一来也许GeForce GTX 680也会有些价格松动。

对于NVIDIA的发烧级Fans来说,GeForce GTX 680的出现让他们又有了更高性能的选择,如果你确实不在意GeForce GTX 680高昂的价格,那么不妨购买一块来体验一下。

另外,对于GPU Boost的功耗变化、自适应垂直同步、TXAA等特性的测试和GeForce GTX 680 SLI的性能测试,由于时间关系,我们还没来得及完成,我们将在随后的《电脑报》中为大家奉上这部分的测试。