史上最强GPU降临 NVIDIA开普勒架构全面解析
硬动态
北京时间2012年3月22日晚9时,NVIDIA代号为开普勒(Kepler)的GK104 GPU终于到了解禁之时。千呼万唤始出来的GeForce GTX680正式登场,吹响了GeForce 600系列进军显卡市场的号角。面对纷纷扰扰的传言,开普勒架构的GTX680真身到底有多给力,能给我们带来哪些全新的感受,下面我们就带大家一探究竟。
GK104硬规格:平衡中提升性能
首先来看看开普勒相对费米在硬件规格方面的改变,我们用两代旗舰产品GTX680与GTX580做一个对比。核心频率部分,GTX680大幅度超越GTX580,正式宣布N卡进入GHz时代,通过特有的GPU Boost技术,还可以提升到1058MHz,当然,改变工作环境之后还能达到更高(后面会详细介绍)。
另一个值得注意的点,就是从开普勒开始,核心与SHADER不再分频,所以GTX680的SHADER频率,也就是CUDA Core的频率保持为1006MHz,相对GTX580的1544MHz有所降低。不过,由于CUDA Core数量从512个提升到1536个,GTX680的处理能力反而比GTX580要高出很多。说到CUDA Core,就不得不说GTX680所采用的SMX,在一个GK104核心当中,拥有4个GPC(图形处理簇),每个GPC里有两组SMX,每个SMX拥有192个CUDA Core,而GTX580的SM只有32个CUDA Core,总共拥有512个CUDA Core。GTX680的CUDA Core数量优势明显,而整个GPU内的控制单元相对GTX580简化了不少,一些控制工作甚至交给了CPU去处理,因此除了性能提升外,GPU本身的功耗也得到大幅度降低。
除了在CUDA Core的数量和核心频率上取得一个能效平衡外,GTX680的光栅单元也比GTX580少,但材质单元却多出一倍。显存规格的变化也是如此,虽然位宽从GTX580的384bit变成了256bit,但借助于6008MHz的高频GDDR5,实现了与GTX580相当的显存带宽。这样做的好处是,既简化了GPU内存控制器的设计,也能有效地控制GPU的功耗。
当然,所有的这些架构上的改变,都是以28nm先进工艺为基础的,在CUDA Core数量提升2倍以上的情况下,GTX680的晶体管数量也相对GTX580增加了5.4亿个,而整体的TDP却从244W降到了195W,外接供电接口也从8Pin+6Pin变为了双6Pin,这样算下来,能效比的确很高。
GPU Boost,性能与功耗的博弈
和Intel的睿频相似,开普勒也带来了自己的智能频率调节技术:GPU Boost。其实在之前的高端独立显卡上,已经有了类似的节能技术,在低负载的情况下,降低GPU频率以减少功耗。不过,这次GPU Boost还带来了智能超频,在需要的时候,提升GPU频率以提升性能。
GPU Boost的频率提升范围来自GPU的功耗上限。在默认功耗阈值下,GPU Boost最高可让GPU从1006MHz提升到1058MHz(这是一个平均值,因为频率是动态变化的),而如果手动调高功耗上限(通过第三方控制软件完成),这个值还可以高到1150MHz,或者更高,当然,超过安全值,GPU也会自动保护。值得一提的是,GPU Boost是完全自动执行的,就算你把GPU超频,它也会在超频后的频率基础上再对频率进行提升——只要没受到功耗限制的话。
总之,使用开普勒架构的高端显卡,可以根据游戏需要去智能地平衡功耗与性能,达到最好的能效比。
FXAA与TXAA,更平滑的画面
既然有了强大的硬件规格,开普勒当然要带来一些足够吸引眼球的特效。抗锯齿技术始终是GPU厂商不断追求的,这次开普勒带来了FXAA和TXAA。其实FXAA也是多点采样抗锯齿技术的一种,不同的是,它相比MSAA效率更高,显存占用更少,FXAA 3在效果上已经赶超MSAA 4X,但对硬件资源的消耗只相当于MSAA 2X。
FXAA看上去已经很厉害了,但是NVIDIA这次还宣布了一个新的抗锯齿技术TXAA。简单地讲,TXAA的原理就是,在游戏中需要AA的地方开启AA,不需要的时候关闭AA以提升性能,因此效率比FXAA还高出很多,而且画面效果更高,仅是TXAA 1就已经可以赶超MSAA 8X的效果,而且对硬件的消耗只相当于MSAA 2X。当然,要完全享受TXAA,首先要有块开普勒架构的显卡,其次还需要游戏本身支持,所以,我们还需要等等。
自适应垂直同步,游戏不再卡顿
在介绍自适应垂直同步技术之前,我们先来说说垂直同步的意义。所谓垂直同步,就是让显示器的刷新频率与游戏的帧数相同,如果游戏的帧数远远大于显示器刷新频率,而没有打开垂直同步的话,画面就会出现撕裂,因为显示器还没来得及刷新画面,游戏已经运算到下一帧或下好几十帧去了。所以为了有顺畅的游戏画面,我们需要打开垂直同步,把游戏帧速限制在与显示器刷新率相同的数值上,例如60fps。
但是,这也有个问题,虽然显卡可以让游戏速度超过60fps,但在某些复杂场景的时候,例如刚才说的大场景快速切换,帧速又掉得厉害,低于60fps,甚至低于30fps都有可能,这时垂直同步技术就会强制这些帧速降到更低的帧速,比如本来是降到46fps,但垂直同步技术会让它强制降到30fps。这在一定程度上就造成了游戏的连续剧烈卡顿,从帧速监测的曲线来看,就是一个个大大的锯齿。
那么自适应垂直同步就能解决这个问题,原理很简单,在游戏速度高于显示器刷新率的时候,自动开启垂直同步,避免画面撕裂,在游戏速度低于显示器刷新率的时候,自动关闭它,避免帧速垂直跌落。这下什么问题都解决了,从游戏帧速监测的曲线来看,原来卡顿形成的锯齿都被平滑的曲线代替了,表现在实际游戏中就是,遇到复杂的场景切换,帧速会平滑地降低,而不是一连串剧烈的卡顿。
单GPU三屏环绕?再加一屏如何
从图上已经很容易理解了,由于提供了双DVI、一个HDMI接口加一个DP接口,GTX680可以实现四屏输出。当然,其中只有三个屏幕可以支持3D环绕显示,另一个则作为辅助,游戏玩家可以在用三屏进行游戏的时候,再用第四个显示器看攻略、视频聊天,甚至是玩对战游戏作弊……发挥你自己的想象力吧。另外,GTX680也是完全支持4K(3840×2160)分辨率显示器的哟。

总 结
NVIDIA开始全线反击
@电脑报王诚:从规格上、技术上,开普勒都有明显的改进,特别是注重功耗与性能的平衡,用更低的功耗带来更高的图形性能,让显卡获得不错的能效比,甩掉高性能、高发烧、高功耗的帽子。另外,包括TXAA和自适应垂直同步等技术带来更优秀的游戏画面和更加流畅的游戏体验。总的来说,开普勒架构在性能、功耗控制和体验方面都有很好的表现,小编看好开普勒会取得不小的成功,虽然晚了几个月,但是从GTX680的强力反击来看,这场好戏刚刚开场。