CPU和GPU“合”谐共鸣

编辑视线

在刚刚落下帷幕的COMPUTEX 2009电脑大展上,厂商们的“表演”可谓精彩纷呈,其中图形芯片巨头NVIDIA向观众展示了独树一帜的Tegra处理器,并大谈CPU+GPU交互运算的好处,而AMD则卖力地宣传Fusion的概念。同时,Intel也透露了集成显示核心的下一代处理器的有关信息。这一切,似乎预示着CPU和GPU将迎来“融合”时代……

GPU,不安分的“芯”

熟悉硬件的朋友可能还记得,一年前电脑芯片业爆发了大规模的口水战,先是Intel在IDF(英特尔开发者论坛)上宣称显卡产业将会消亡,而后是NVIDIA宣称GPU将取代CPU成为PC核心。似乎一夜之间,CPU和GPU成了水火不容的冤家。

其实,出现这种局面的主要原因是在技术进步的推动下,GPU的应用领域得到了极大的拓展。尤其是在通用计算领域,GPU已经可以代替CPU进行视频转码、图形处理加速和各种科学运算,更有甚者,GPU在某些运算中的效率比CPU还要高很多。

抛开常规应用程序不说,现在就连操作系统也向GPU抛出了橄榄枝。这不,NVIDIA公司CEO黄仁勋就在COMPUTEX 2009大会上向大家展示了GPU和Windows 7的完美“结合”。例如,在引入了WDDM 1.1显示驱动模式后,普通的系统桌面绘制、图片处理等工作将会更多地交给GPU执行,这样操作系统的运行速度相比Windows Vista有了明显的提升。另外,在文档中需要超大尺寸字体时(如数十倍或百倍于正常字体),Windows 7将会调用GPU来进行加速,让你翻阅文档时不再有延迟感。

无独有偶,苹果在前不久发布的Snow Leopard(Mac OS X 10.6)操作系统中,同样也将桌面绘制的重任交给了GPU。如此看来,在新的操作系统中,GPU再也不是游戏玩家的专利,而是系统运行的必需部件。

我们姑且不论GPU核心论是否正确,至少它反映出了一种趋势——除了CPU,GPU也正逐渐成为衡量一台电脑性能高低的重要因素。

CPU和GPU,缺谁都不行

我们知道,因为设计目标不同,CPU和GPU在功能上有本质的区别。CPU是基于程序计算的平衡性设计,在操作系统、系统软件、应用程序、通用计算、系统控制等领域有着优良的表现;而GPU最早应用于显卡,在图形类矩阵运算以及非图形类并行数值计算、GPU 的浮点运算上表现非常出众。

也就是说,CPU和GPU的工作重点不一样,CPU担当的责任要重得多,它面对的是整个系统,要照顾到方方面面,除了要保证整个系统高速运行,还要确保系统稳定运行。任何错误都可能会是致命的,所以CPU很难做到“专心致志”。它会经常被打断,停下手头的工作,去处理正常的或者非正常的紧急任务,否则系统就会崩溃。相比之下,GPU的责任就要轻得多,图形计算如果出了错,并不会影响程序本身的运行,最多是屏幕上显示的图形错位了或者是颜色乱了等。

按照CPU和GPU的设计初衷,这两类产品也许是两条永不相交的平行线,但现在却在人们对PC应用需求的不断进化中慢慢产生了交点。随着人们对视觉计算需求的与日俱增,CPU已经难以通过扩展指令集的方式来加强其“中央集权”,这也间接使得GPU的地位大幅度提升。

根据我们的调查,PC用户的日常应用并非是单一的数学运算或者视觉享受,复合型的多应用需求使得在不同时候对于PC各配件的依赖性也不相同。换句话说,就是在我们的电脑系统中,CPU和GPU都很重要,一个也不能少。

GPU率先奏响“合”谐曲

俗话说,合久必分,分久必合。这话一点不假。就在人们还津津乐道于“CPU和GPU,谁才是核心”的话题时,两者已经开始了“合”家团圆的计划,而第一个“吃螃蟹者”就是NVIDIA公司推出的Tegra处理器。在这次COMPUTEX 2009展会上,我们终于看到了它的庐山真面目。

这个小“家伙”是基于ARM11 MPcore多内核架构,这意味着Tegra无法像酷睿2系列或者Athlon 64系列处理器那样运行x86平台的程序,但NVIDIA的优势——图形卡技术还是给Tegra提供了强大的竞争力,在这款产品的核心中集成了被称作HD AVP的高清视频/音频处理内核。通过这种内核+GPU+AVP的设计,搭载Tegra处理器的移动设备能够流畅播放高清视频(720P),甚至可以流畅玩《Quake3》游戏。

单纯从结构来说,Tegra可以看作是集成了传统意义上的CPU、GPU等芯片的一个功能集合体,它会利用不同的处理器去完成不同的功能计算,每一个任务都会处理得很出色。和传统x86架构平台过于强调CPU性能不同的是,Tegra追求的是CPU与GPU的平衡,力争让整个平台达到最佳的性能状态。

在芯片融合的发展道路上,GPU厂商已经走在了前面,而传统处理器巨头们自然不甘落后,他们也将拿出自己的“杀手锏”。

CPU也要走“融合”路

GPU地位在电脑中的提升,意味着CPU的统治力被弱化。为此Intel和AMD都选择GPU和CPU融合的道路。根据Intel的规划,45nm Nehalem家族中原计划的集成显示核心的CPU——Havendale已经消失不见,取而代之的是32nm版双核Clarkdale。在内部架构上,Clarkdale与Havendale相比基本没有区别,集成包含有GPU和GMCH(Graphics Memory Controller Hub,图形内存控制器)的功能模块。只要配合P5系列芯片组,就能直接实现图形输出,而无需任何图形核心的帮助。

和Intel大步向前,直接在CPU中集成显示核心不同,目前在制程上落后的AMD选择了更为稳妥的策略。AMD公司曾经表示,Shrike平台将会使用45nm的生产工艺,配备3个K10处理器核心、一个GPU核心,并且将会内置DDR3内存控制器。而最新的报道则指出,CPU部分实际上只会内置2个核心,而GPU部分则将会采用AMD公司新一代 RV800系列显示芯片的架构设计。2010年初该芯片将作为过渡产品转移到32nm制程,紧接着Fusion(融合)的第二代产品“Bulldozer”将会出现,开发代号为“Falcon”。

把显示核心“注入”CPU内部,与其说是技术的巨大进步,不如说是CPU和GPU厂商的市场杀手锏。由于Intel和AMD同时生产GPU和CPU,这样的内置方案可以很好地避免显示芯片的排他性。站在Intel的角度,这样有利于巩固其集成显卡市场霸主的地位,而从AMD方面来看,则可以避免NVIDIA进一步向自家平台渗透。与此同时,在半导体制程不断提升的情况下,CPU和GPU的体积已经足够小巧,能被封装到一起。两者借助相同的显存控制器就能实现协同工作。

CPU+GPU,“合”乐不为

虽然CPU和GPU的融合进程,更像是芯片巨头们的跑马圈地,但是这样的融合为我们带来的计算体验提升,却是立竿见影的。Windows 7和Snow Leopard操作系统更迅捷的反应也有赖于GPU的支持。随着CPU和GPU的融合,整个市场蛋糕会越来越大,各种软件制造商也会想方设法通过利用“CPU+GPU”模式提升软件效率。

在未来,迟缓的界面操作将不复存在,2D和3D世界的边界也将越来越模糊,而这一切都会从GPU和CPU的“融合”开始。

23-d01-01.jpg
DX10显卡在Windows 7下都有符合WDDM 1.1规范的驱动程序
23-d01-02.jpg
使用GPU加速的Mac OS X Snow Leopard操作系统更漂亮
23-d01-04.jpg
采用32nm的Clarkdale处理器,可以清楚地看见两个核心(其中一个为GPU)
23-d01-03.jpg
小巧玲珑的Tegra处理器,大小和我们的指甲盖相差无几
23-d01-05.jpg
AMD的秘密武器——Fusion平台