CPU和GPU“合”谐共鸣

编辑视线

广东刘泽申 · 2009年6月15日第23期

在刚刚落下帷幕的COMPUTEX 2009电脑大展上，厂商们的“表演”可谓精彩纷呈，其中图形芯片巨头NVIDIA向观众展示了独树一帜的Tegra处理器，并大谈CPU+GPU交互运算的好处，而AMD则卖力地宣传Fusion的概念。同时，Intel也透露了集成显示核心的下一代处理器的有关信息。这一切，似乎预示着CPU和GPU将迎来“融合”时代……

GPU，不安分的“芯”

熟悉硬件的朋友可能还记得，一年前电脑芯片业爆发了大规模的口水战，先是Intel在IDF（英特尔开发者论坛）上宣称显卡产业将会消亡，而后是NVIDIA宣称GPU将取代CPU成为PC核心。似乎一夜之间，CPU和GPU成了水火不容的冤家。

其实，出现这种局面的主要原因是在技术进步的推动下，GPU的应用领域得到了极大的拓展。尤其是在通用计算领域，GPU已经可以代替CPU进行视频转码、图形处理加速和各种科学运算，更有甚者，GPU在某些运算中的效率比CPU还要高很多。

抛开常规应用程序不说，现在就连操作系统也向GPU抛出了橄榄枝。这不，NVIDIA公司CEO黄仁勋就在COMPUTEX 2009大会上向大家展示了GPU和Windows 7的完美“结合”。例如，在引入了WDDM 1.1显示驱动模式后，普通的系统桌面绘制、图片处理等工作将会更多地交给GPU执行，这样操作系统的运行速度相比Windows Vista有了明显的提升。另外，在文档中需要超大尺寸字体时（如数十倍或百倍于正常字体），Windows 7将会调用GPU来进行加速，让你翻阅文档时不再有延迟感。

无独有偶，苹果在前不久发布的Snow Leopard（Mac OS X 10.6）操作系统中，同样也将桌面绘制的重任交给了GPU。如此看来，在新的操作系统中，GPU再也不是游戏玩家的专利，而是系统运行的必需部件。

我们姑且不论GPU核心论是否正确，至少它反映出了一种趋势——除了CPU，GPU也正逐渐成为衡量一台电脑性能高低的重要因素。

CPU和GPU，缺谁都不行

我们知道，因为设计目标不同，CPU和GPU在功能上有本质的区别。CPU是基于程序计算的平衡性设计，在操作系统、系统软件、应用程序、通用计算、系统控制等领域有着优良的表现；而GPU最早应用于显卡，在图形类矩阵运算以及非图形类并行数值计算、GPU 的浮点运算上表现非常出众。

也就是说，CPU和GPU的工作重点不一样，CPU担当的责任要重得多，它面对的是整个系统，要照顾到方方面面，除了要保证整个系统高速运行，还要确保系统稳定运行。任何错误都可能会是致命的，所以CPU很难做到“专心致志”。它会经常被打断，停下手头的工作，去处理正常的或者非正常的紧急任务，否则系统就会崩溃。相比之下，GPU的责任就要轻得多，图形计算如果出了错，并不会影响程序本身的运行，最多是屏幕上显示的图形错位了或者是颜色乱了等。

按照CPU和GPU的设计初衷，这两类产品也许是两条永不相交的平行线，但现在却在人们对PC应用需求的不断进化中慢慢产生了交点。随着人们对视觉计算需求的与日俱增，CPU已经难以通过扩展指令集的方式来加强其“中央集权”，这也间接使得GPU的地位大幅度提升。

根据我们的调查，PC用户的日常应用并非是单一的数学运算或者视觉享受，复合型的多应用需求使得在不同时候对于PC各配件的依赖性也不相同。换句话说，就是在我们的电脑系统中，CPU和GPU都很重要，一个也不能少。

GPU率先奏响“合”谐曲

俗话说，合久必分，分久必合。这话一点不假。就在人们还津津乐道于“CPU和GPU，谁才是核心”的话题时，两者已经开始了“合”家团圆的计划，而第一个“吃螃蟹者”就是NVIDIA公司推出的Tegra处理器。在这次COMPUTEX 2009展会上，我们终于看到了它的庐山真面目。

这个小“家伙”是基于ARM11 MPcore多内核架构，这意味着Tegra无法像酷睿2系列或者Athlon 64系列处理器那样运行x86平台的程序，但NVIDIA的优势——图形卡技术还是给Tegra提供了强大的竞争力，在这款产品的核心中集成了被称作HD AVP的高清视频/音频处理内核。通过这种内核+GPU+AVP的设计，搭载Tegra处理器的移动设备能够流畅播放高清视频（720P），甚至可以流畅玩《Quake3》游戏。

单纯从结构来说，Tegra可以看作是集成了传统意义上的CPU、GPU等芯片的一个功能集合体，它会利用不同的处理器去完成不同的功能计算，每一个任务都会处理得很出色。和传统x86架构平台过于强调CPU性能不同的是，Tegra追求的是CPU与GPU的平衡，力争让整个平台达到最佳的性能状态。

在芯片融合的发展道路上，GPU厂商已经走在了前面，而传统处理器巨头们自然不甘落后，他们也将拿出自己的“杀手锏”。

CPU也要走“融合”路

GPU地位在电脑中的提升，意味着CPU的统治力被弱化。为此Intel和AMD都选择GPU和CPU融合的道路。根据Intel的规划，45nm Nehalem家族中原计划的集成显示核心的CPU——Havendale已经消失不见，取而代之的是32nm版双核Clarkdale。在内部架构上，Clarkdale与Havendale相比基本没有区别，集成包含有GPU和GMCH（Graphics Memory Controller Hub，图形内存控制器）的功能模块。只要配合P5系列芯片组，就能直接实现图形输出，而无需任何图形核心的帮助。

和Intel大步向前，直接在CPU中集成显示核心不同，目前在制程上落后的AMD选择了更为稳妥的策略。AMD公司曾经表示，Shrike平台将会使用45nm的生产工艺，配备3个K10处理器核心、一个GPU核心，并且将会内置DDR3内存控制器。而最新的报道则指出，CPU部分实际上只会内置2个核心，而GPU部分则将会采用AMD公司新一代 RV800系列显示芯片的架构设计。2010年初该芯片将作为过渡产品转移到32nm制程，紧接着Fusion（融合）的第二代产品“Bulldozer”将会出现，开发代号为“Falcon”。

把显示核心“注入”CPU内部，与其说是技术的巨大进步，不如说是CPU和GPU厂商的市场杀手锏。由于Intel和AMD同时生产GPU和CPU，这样的内置方案可以很好地避免显示芯片的排他性。站在Intel的角度，这样有利于巩固其集成显卡市场霸主的地位，而从AMD方面来看，则可以避免NVIDIA进一步向自家平台渗透。与此同时，在半导体制程不断提升的情况下，CPU和GPU的体积已经足够小巧，能被封装到一起。两者借助相同的显存控制器就能实现协同工作。

CPU+GPU，“合”乐不为

虽然CPU和GPU的融合进程，更像是芯片巨头们的跑马圈地，但是这样的融合为我们带来的计算体验提升，却是立竿见影的。Windows 7和Snow Leopard操作系统更迅捷的反应也有赖于GPU的支持。随着CPU和GPU的融合，整个市场蛋糕会越来越大，各种软件制造商也会想方设法通过利用“CPU+GPU”模式提升软件效率。

在未来，迟缓的界面操作将不复存在，2D和3D世界的边界也将越来越模糊，而这一切都会从GPU和CPU的“融合”开始。

采用32nm的Clarkdale处理器，可以清楚地看见两个核心（其中一个为GPU）