处理器的“云端”之战

行业观察

飘雪 · 2010年8月2日第30期

云计算自从被提出以后，就被很多人认为是一个噱头、一个吸引人注意的名词。不过很多软件厂商甚至网络巨头都将云计算看作是企业发展新方向，比如Google、亚马逊、VMware、微软等公司早就把云计算作为未来的长期发展战略。正是在大型软件企业和互联网巨头对云计算的推动下，处理器厂商们也正式迈上了云计算的征程，如Intel、AMD都针对云计算发布了云处理器，誓做云计算的“核心武器供应商”。那么该云处理器究竟有何特点，是否会对服务器和数据中心带来影响呢？

何为云处理器

云处理器被称为“单芯片云计算机（SCC，Single-chip Cloud Computer）”，严格来说有点脱离传统意义处理器的架构范畴，云处理器的组织结构非常类似于通过互联网提供云计算资源的数据中心。现有的云计算数据中心都是庞然大物，由成千上万台计算机互连组成，并行处理各种数据和任务。那么处理器厂商们如果将它们统统缩小集成在一颗小小的微处理器芯片之内呢？

云处理器采用了一种用于互联网上建立云计算资源的数据中心的结构形式，俗称2D（二维）网络架构。目前处理器内核架构主要是采用1D（一维）架构，存在内核数量门限的瓶颈——目前所能整合的内核数量最多只能达到32个内核这个水准。而云处理器采用2D网络设计就可以很好解决这个问题，即便整合1024个内核也不是难事，并能有效解决1D架构在多内核下总线数据传输的高协调、高传输量的问题。

目前主流处理器所采用的一维总线设计，就好像北京市只有一条长安街，虽然可以把长安街越修越长，当你在这个总线上只挂一两个核的时候，效率还是比较高的，但当你挂上四个核、八个核、十六个核，这时候任何一个核与核之间的通信都要求把别的工作停下来，大家都要等待，效率就会很低；在挂的核的数目越来越多的时候，大家等待的时间会越来越多，功耗也会越来越大。而2D架构的总线是采用网络状设计，其总线架构就好比北京市既有东西向的很多条街，也有南北向很多条街，比如64核云处理器的总线，就相当于南北8条通道，东西也有8条通道，能够把核与核之间通过二维的结构互连起来。在任何一个地方有阻碍的时候，数据就可以绕开去另外一个方向，效率高出不少。

正是借助这种独特的内核架构，处理器厂商们在一个邮票大小的单芯片上就能实现一个小型“云数据中心”（云数据中心是由数十台甚至数千台计算机通过有线网络互连组成的可并行处理大量任务和数据的计算机集群）才能实现的功能，而且各内核可以根据不同的应用设计功能。

目前服务器虚拟化是大势所趋，虚拟化对于用于云计算的服务器集群来说也是意义非凡。云处理器的另一个标准就是必须支持虚拟化，能够在不影响效能表现的情况下成功地处理繁重的任务，支持大规模的云计算延展，并确保以互联网为基础的云计算环境的可靠性。除此之外，云处理器相比传统处理器更注意能效方面的控制。以英特尔云处理器原型为例，虽然它集成了48个全功能的IA-32处理核心，但英特尔根据云计算的特点在设计时简化了许多硬件功能，将这些复杂的工作全部移交给软件层，可以将处理器的整体功耗控制在25W到125W。

处理器厂商的云芯片计划

从技术发展来看，云计算已成为促进下一代服务器处理器向更高速发展的主流技术，代表着处理器发展的方向。它可为未来的计算机特别是服务器创建目前难以置信的扩展性能，促进开发全新的应用程序和人机界面。因此，目前各个处理器厂商的未来CPU发展计划也纷纷向云计算靠拢。比如作为一家芯片级平台的供应商，英特尔早就立志在云时代扮演重要的角色。针对云计算芯片的发展，英特尔在2007年2月11日就公布了世界上首个含有80个内核的、具有与超级计算机性能相似的可编程处理器计划，这个可以看成是英特尔的云处理器的原型。

在这个设计理念基础之上，明年英特尔将针对云计算芯片市场推出具有48个内核的云处理器。这款处理器将采用45nm CMOS工艺制造，在一个6×4的2D网格内集成48个全功能的IA-32处理核心，每个网格集成2个内核、2个二级缓存、1个“信息缓冲”以及可与其他块交换数据的名为“路由器”的开关电路，路由器之间为二维网格状连接。工作频率以块为单位独立控制，工作电压则以由4个块构成的6个“存储体”为单位独立控制。芯片外部集成了4个DDR3内存控制器，并且其工作频率及工作电压也可独立控制，这意味着处理器的工作频率可分28个频率独立控制，工作电压可分8个等级独立控制，从而能让功耗控制在 25W～125W，只相当于目前一款双核桌面处理器的水平。

不过，针对英特尔的云处理器方案，AMD目前更偏向于CPU+GPU的异构模式，并提出了融聚概念（Fusion）。在当前的高性能计算系统和应用中，多核异构系统在满足高性能计算的某些特殊应用时表现出了比较出色的性能。因此AMD提出了融聚概念（Fusion），将CPU与GPU结合推出加速处理器（APU），并在不久前举行的台北电脑展上展出了相应的产品，预计明年年中AMD会推出代号为Llano及Ontario的两款APU处理器。另外AMD近期推出了极其重要的云计算产品，就是它的马尔库尼计划，这对AMD来说这也是在处理器技术上的一大突破。在推出基于12核架构的Opteron 6100系列服务器处理器后， AMD在6月底针对云计算市场正式发布了皓龙4000系列平台。

由于云计算对CPU内核架构要求的侧重点有所改变，因此云处理器并不再是AMD、Intel等专业处理器厂商们的专利。比如在2009年11月，一家名为Tilera的公司就推出了一款集成100个内核的云处理器。Tilera的云处理器基于二维的网状架构，把重点放在了内核与内核之间的通信上，这样的方式在提供高性能应用的同时，还能大大节约能耗。

30-企业1-1-2.jpg — Tilera的具有100个内核的云处理器结构图

解读AMD皓龙4000系列云计算芯片

AMD一直希望能在云计算市场担当关键角色，不久前它就针对云计算平台推出了皓龙4000系列处理器。

从新一代皓龙4000处理器开始，产品已经不像以往那样仅仅根据单路、双路、多路来对产品做简单的划分，而是根据用户市场的需求来划分。皓龙4000就是专为云计算、超大规模数据中心设计的，因此功耗仍然是其首要考虑因素。AMD皓龙4000系列平台提供每核功耗低于6W的性能，与前一代产品相比，不仅功率降低最高可达24%，而且在同样的功耗范围内可以支持两倍以上的服务器数量。在接口方面，AMD的皓龙4000系列平台使用了新的C32接口，该接口在设计上与现有的SocketF接口拥有同样的1207针脚，只是重新定义了针脚，使得新平台可以支持更高容量和速度的DDR3内存，皓龙4000系列平台支持的内存通道频率最高为1333MHz。

需要说明的是，目前无论是英特尔还是其他厂商的云处理器产品都还处在初级阶段（实验阶段）。目前市场上厂商们针对云计算市场推出的处理器产品，更多是在目前服务器处理器基础上进行相应改进的产物——如简化内核设计、重点从过去追求性能转向注重云应用方面的改进并最大程度降低能耗等。AMD皓龙4000系列处理器就是属于这种情况，不过这也体现了处理器厂商对云计算市场的关注。

云处理器推动HPC和智能计算发展

云处理器代表了未来处理器技术发展的一种方向，它已经成为推动某些特殊应用的重要力量。它可为未来的计算机特别是服务器创建目前难以置信的扩展性能，促进开发全新的应用程序和人机界面。比如，目前要实现“沉浸式、个性化、互动、智能”的应用，如虚拟现实、3D互联网、计算机用“视觉”识别运动物体、用脑电波控制计算机等等，现在的处理器性能并不够用，只能通过多服务器架构和协作，在成本控制上不是任何一家企业可以承受的。而随着云处理器的出现，可为未来的各种智能设备带来更强的综合处理性能，未来的智能设备中配备一款这样的芯片就能实现人机交互，显著改善数据中心或云计算服务中心的能效比。

另外，在HPC（高性能计算）领域的竞争激烈，使得HPC系统的规模越做越大，系统能耗大成为HPC发展面临的主要挑战。而未来云处理s器在提高计算性能的同时，也可为大型计算机系统、高性能计算集群的能耗降低作出重要贡献，实现真正的更先进的“绿色计算”能力。特别是随着云处理器技术的成熟，未来用单台或数台服务器/工作站甚至个人电脑实现高性能计算将成为可能，这将大大降低入门级高性能计算的门槛，为中小企业甚至个人高性能计算应用带来曙光。当然未来的云处理器的核心不会是一成不变的，其架构也许会是同构和异构的综合体，它不仅将针对特定应用集成更多同一类型的内核，也将针对更智能化的应用集成不同类型的内核。

编后：我们也要清楚地看到，要想让云处理器真正走向实用化，还需要厂商解决好协调、控制、监视、并行编程、采用多线程解决同一个问题、在并行线程之间通信与同步等方面的一系列问题，并且需要软件厂商大力合作。在英特尔、AMD相关方案还没成熟，在针对多核处理器的编程技术尚未有重大突破的情况下，云处理器还有很长的路要走。