低功耗服务器CPU异军突起

服务器

在频率更高、核心更多的服务器CPU设计思路风光不再的现在,开发用于服务器的低功耗处理器产品成为了未来的发展方向。面对低功耗的服务器CPU的发展趋势,处理器制造商正在致力于研发各种低功耗服务器CPU,以顺应绿色节能的发展趋势。

英特尔Atom欲“转型”

作为纵横处理器领域40余年的沙场老将,英特尔注定不会放弃这个新兴市场。目前英特尔早就针对低功耗服务器制定了相应的处理器产品计划。打先锋的是2011年年初发布的、来自至强家族的E3低功耗处理器,这是在Xeon 3000系列基础上推出的低功耗处理器。虽然相比以前的服务器处理器来说,至强E3的功耗控制已经相当成功,热设计功耗低至20W,但相对于特殊的低处理要求的运算节点而言,至强E3的功耗还是偏高。因此针对部署在各节点上处理要求较低的低功耗和高密度的服务器解决方案,英特尔还将推出基于Atom凌动处理器微架构、功耗不足10W的服务器处理器。

相信大家对Atom凌动处理器并不陌生,这款当初针对小型移动平台和上网本的处理器,可以说是英特尔历史上体积最小、功耗最低的处理器。在保持与酷睿2双核指令集兼容性的同时,Atom还支持多线程处理,其热设计功耗仅为0.6W到2.5W,而处理器的频率却能达到 1.8GHz,完全可以满足某些低工作负荷的要求。不过,随着上网本淡出市场,Atom处理器似乎就要退出大家的视线,此时服务器厂商们看上了Atom凌动处理器的低功耗和节能特性,比如惠普、戴尔等知名的服务器制造商就曾尝试推出基于Atom处理器的低功耗服务器,面向低运算量的应用如打印、数据存储和电子邮件服务等市场,并取得了不错的反响。

不过,针对小型移动平台和上网本的Atom处理器仍难担当大任,它在服务器方面的应用依然存在较多问题,例如可支持最大内存较小、各个处理器之间位宽低以及产品种类较少等。针对这些问题,英特尔将对Atom处理器进行改进,并计划在今年推出专门用于低功耗服务器的Atom处理器。

服务器版的Atom处理器开发代号为Centerton,将采用SoC片上系统整合设计,目标就是全面针对服务器进行优化,发挥X86架构处理器的独特优势。Centerton Atom处理器将会集成两个Saltwell核心,主频最高1.6GHz,每个核心拥有32KB L1指令缓存和24KB L1数据缓存,并共享512KB的L2缓存,整合单通道DDR3内存控制器及PCI-E2.0控制器,并支持超线程、64位计算、VT-X虚拟化等关键技术。对于大家所关注的功耗,Centerton Atom处理器最先采用32nm制程,热设计功耗为5W~8W,未来改用22nm制程后,功耗还会更低。Centerton Atom处理器发布后,相信将为低功耗服务器市场带来一丝“绿色”的生机。

10-a12-1-1.jpg
Atom凌动处理器会加入服务器处理器阵营吗

ARM处理器阵营逐鹿中原

●ARM进军服务器CPU市场

另一个异军突起的低功耗处理器厂商就是ARM,自从它去年宣布进入服务器领域以来,业界就开始沸腾起来。也许有不少朋友认为小小的ARM进军服务器市场更多是噱头。毕竟在配备ARM架构处理器的智能手机上看1080P的高清视频还要借助视频硬解码模块,ARM架构的处理器怎么能用于服务器呢?不过服务器从来就不是“一个人的战斗”,看看最新的全球HPC TOP500榜,排名末尾的超级计算机使用的是以万为单位的CPU核心。因此只要“芯”足够多,ARM架构的处理器同样有能力匹敌专业的服务器CPU。

在芯片设计上,不同于传统的英特尔处理器设计,ARM试图以一种不同的方式产生相同的原始计算能力:英特尔的设计是将数百万个晶体管排列在复杂的架构中,而ARM架构芯片则注重简洁性,它利用数量更少的晶体管实现更高的效率和更快的速度。针对服务器市场的Cortex-A9处理器就采用了广受支持的ARM v7架构,基于最先进的推测型八级流水线,该流水线具有高效、动态长度、多发射超标量及无序完成的特征。如果采用多核架构,Cortex-A9的性能并不逊色于英特尔的Atom处理器。不过Cortex-A9的最大优势还是拥有极为优秀的效能,其功耗是目前服务器市场上同类低功耗芯片的五分之一。

以1GHz的Armada 310芯片为例,它的功耗只有700毫瓦,即使未来主频提升到2GHz,其功耗也不到1W,在每瓦特性能上可以达到英特尔Atom处理器的5倍。大家不要小看ARM架构处理器的效能,如果优化得当,相信ARM架构的处理器能赶上专业服务器CPU的性能。因此,对于像Google、eBay、Facebook等动辄需要成千上万台服务器的数据中心用户来说,仅凭效能这一点,就能够为用户省下许多真金白银,非常有“杀伤力”,这也是为什么今年以来ARM传闻不断的根源。

●三大芯片制造商助力ARM

就在ARM宣布进军服务器市场后,在2011年11月Marvell就推出了一款针对服务器设计的四核ARM处理器——Armada XP。和很多ARM处理器一样,Armada XP依然是一颗高集成度的SoC片上系统芯片,其运算内核为四核,频率最高1.6GHz,拥有2MB二级缓存,其运算性能可达16600DMIPS,而功耗低于10W。Armada XP处理器提供64bit DDR2/DDR3/DDR3L内存接口,最高频率800MHz并支持ECC,四条PCI-E 2.0通道,4路千兆以太网接口,最高16条Marvell SERDES多功能通道可提供PCI-E、SATA、SGMII、QSGMII等接口,另外还提供多个USB接口。Armada XP处理器将主要用于云计算等企业应用领域,诸如高性能网络设备、网页服务器,也可用于家用的NAS、媒体服务器等。

另一个值得关注的公司就是Calxeda,它在2011年11月也推出了基于ARM架构、专门面向服务器应用的EnrgyCore ECX-1000处理器。EnrgyCore ECX-1000采用高度集成的SoC片上系统设计,拥有最多四个核心,主频为1.1GHz~1.4GHz,每个核心32KB一级指令缓存、32KB一级数据缓存,所有核心共享4MB ECC二级缓存,整合浮点单元并支持NENO、TrustZone技术,而且每个核心都有独立的供电域以降低整体功耗,功耗只有1.5W。Calxeda宣称,一套典型的传统X86集群有400台服务器、10个机架、20个网关、1600条线缆,每小时功耗为91千瓦,整体成本3300万美元;而要达到同样的性能,如换成他们的ARM架构平台则包含1600台服务器、1~2个机架、2个网关、41条线缆,每小时9.9千瓦的功耗,成本不过120万美元。

英伟达对ARM架构的服务器处理器也表现出了深厚的兴趣。其实英伟达公司并不是首次涉足服务器芯片领域,它的Tesla处理器早就应用到HPC系统上,它所倡导的“CPU+GPU”异构计算模式就很好地缓解了HPC所面临的高性能、高功耗的困境。针对ARM架构的服务器CPU,英伟达目前正在开发代号为“丹佛”的服务器芯片。“丹佛”内核将集成英伟达GPU图形处理器,集图形并行处理能力和低功耗特性于一身,利用CPU和GPU并行处理能力进行复杂计算,在提高服务器运算速度的同时,还能降低功耗。

英伟达将图形处理器与ARM处理器加以结合的想法是颇具吸引力的方案。GPU目前已经应用于很多世界顶尖的超级计算机之中,并且在某些特定类型的应用程序中能够提供比传统CPU更强大的处理性能。这样的强强联手能够在能源消耗不变的情况下为客户带来更高的计算密度与更强的运算性能,同时成本也会更低。不过,“丹佛”至少还要三年多才能瓜熟蒂落:首款“丹佛”处理器——Stark(斯塔克)预计在2015年发布上市。目前,英伟达将尝试把最新发布的Tegra 3处理器引入到服务器领域,英伟达公司不久前曾宣称在巴塞罗那组建一台超级计算机,该HPC就采用了Tegra 3处理器。

“ARM系”厂商进入服务器领域,代表着低功耗服务器迈出了可喜的发展步伐,然而这并不代表它们就能够马上占领市场。虽然时下大部分最新的ARM架构芯片设计都在向服务器芯片靠拢,但在整体性能上,ARM架构的芯片还是无法与传统的服务器处理器相提并论,仅仅支持32bit寻址运算就大大限制了它的应用范围。ARM进军服务器市场的另一大障碍是软件兼容性以及硬件配套设施,因为大部分数据中心的软件代码都是面向X86服务器编写的,市场上几乎没有为ARM架构处理器设计的服务器芯片组。

不过,ARM的主要目标是低功耗服务器市场,比如云计算服务器市场。对以满足云计算服务为主的未来的ARM架构服务器芯片而言,与X86服务器CPU的二进制兼容性问题不大,毕竟在云计算环境下,二进制兼容性的重要性大大降低了,同时对性能要求也不高。而且ARM已经于2011年10月末公布了第一款64位微处理器架构,即ARMv8,并准备将它打造为专门针对从传感器到高端服务器市场的解决方案,预计相应的产品将在2014年上市。

10-a12-1-2.jpg
ARM架构的处理器应用于低功耗服务器上不是梦
10-a12-1-3.jpg
基于EnrgyCore ECX-1000处理器的服务器集群
10-a12-1-4.jpg
英伟达推出的低功耗处理器Tegra3

谨慎前行的AMD

相对于英特尔、ARM,AMD目前仍没有推出定制的低功耗服务器处理器,不过这并不意味着它就打算放弃这个高利润市场。

在2012年,AMD计划推出低功耗的皓龙3000系列服务器处理器,参与微型服务器和低功耗服务器市场的竞争。皓龙3000系列的第一款产品代号为Zurich,它具有四核、六核和八核的版本,采用AM3+插槽,支持带有ECC的DDR3内存,主要针对超高密度、超低功耗的单路网络主机(Web Hosting)/网络服务器(Web Serving)以及微型服务器等市场,将在2012年上半年发布。

@梁敏