“芯”征程，新一代X86服务器处理器到来

行业观察

阿珍 · 2010年3月29日第12期

英特尔有著名的Tick-Tock战略（Tick-Tock就是“钟摆”的意思，对应“工艺年－架构年”），Tick指每隔两年的第一年推出更小、更先进制程的处理器；Tock指每隔两年的第二年推出新架构的处理器。今年属于英特尔的工艺年，因此英特尔接连推出了数套不同系列的采用32nm制程工艺的处理器。其中，2010年3月17日在北京发布的至强5600（Westmere-EP）系列处理器是英特尔新一代双路服务器和工作站处理器的翘楚。它有何特点呢？会对数据中心、高性能计算、云计算和虚拟化应用产生什么影响呢？

至强5600为啥这么“强悍”

至强5600（Xeon 5600）是英特尔继去年3月31号推出至强5500系列（Nehalem-EP）后最新推出的代表产品，至强5600基于Westmere-EP核心，具有32nm制程工艺、六核心、12MB三级缓存等新特性，是英特尔Tick-Tock战略中的Tick产品，可为分布于不同行业和专注于不同应用领域的用户带来更加出色的计算性能。

●32nm制程工艺的代表

Westmere-EP（至强5600）是Nehalem微架构的工艺改进版本，从Nehalem-EP（至强5500）的45nm制程进化为32nm，其他方面变动不大。对于32nm制程工艺，相信很多读者已不陌生，因为英特尔先期发布的Core i3/i5/i7系列处理器已率先采用了该工艺。大家知道，32nm制程技术是英特尔已经推出并即将大规模投入量产的新的处理器制造技术，它是在已经大获成功的45nm制程技术的基础上，采用了第二代高K+金属栅极晶体管以及第四代应变硅技术，是为英特尔Westmere微架构的处理器量身打造的生产技术。

从技术传承上看，32nm制程是基于45nm制程的改良版本。在45nm制程工艺中，高K电介质的等效氧化层厚度为1.0nm。而在32nm的制程工艺中，由于在关键层上首次使用了沉浸式光刻技术，所以氧化层的厚度仅为0.9nm，而栅极长度则缩短为30nm，这让32nm制程具有业内最紧凑的112.5nm栅极间距。

32nm制程工艺采用了与英特尔45nm制程工艺一样的置换金属栅极工艺流程，这样有利于英特尔充分利用现有的成功工艺。这些改进对于缩小集成电路（IC）尺寸、提高晶体管的性能至关重要。采用高K+金属栅极晶体管的32nm制程技术可以帮助设计人员同时优化电路的尺寸和性能。由于氧化层厚度减小，栅极长度缩短，晶体管的性能可以提高22%以上。且32nm技术可针对漏电电流作出进一步优化，与45nm制程相比，NMOS晶体管的漏电量减少为原来的1/5，PMOS晶体管的漏电量则减少为原来的1/10以上。换句话讲，根据NMOS、PMOS晶体管的泄漏电流和驱动电流为原来的1/10对比，32nm制程的能效相比45nm制程有明显提高──要么能在同样的漏电率下提高晶体管速度（14%～22%），要么能在同样的速度下降低漏电率，让电路的尺寸和性能均可得到显著优化。

除此外，32nm制程还采用了第四代应变硅技术、Low-K介质技术和铜互联技术等，可将晶体管体积缩小大约30%，从而有利于提高晶体管的性能，同时也使得英特尔可以争取更多的时间和机会进行技术创新，让英特尔可以为Westmere-EP添加更多的核心，或者在同样TDP封装下提高时钟频率。与上一代产品相比，Westmere-EP（至强5600）核心面积为240平方毫米，具有11.7亿个晶体管，而至强5500核心面积为246平方毫米，晶体管数量只有7.81亿个，从中可以看到制程的进步让晶体管的密度更大，芯片尺寸更小。32nm制程工艺优势尽显。

●“进化”到六核心

从45nm制程提高到32nm制程，单位面积上晶体管数量的增加让Westmere-EP可以增加两个核心（Westmere-EP也会提供四核心的产品），让英特尔双路服务器的处理器进入六核时代，并且集成的L3缓存（三级缓存）也增加50%，达到12MB。

为了提升六核心的效能，新处理器具备增强版的核心智能节能技术，可以调节六个内核以及Uncore部分的能耗状态，让效能比更接近理想的线性状态。从技术上看，与至强5500一样，至强5600的芯片被分为“Core”和“Uncore”两部分，每三个核心为一组，核心区域具有独立的时钟频率和供电部分，六个核心共享12MB三级缓存。同样具备Nehalem微构架中英特尔为每个核心引入的Power Gate（功率门限）技术，可以关闭空闲的内核，将内核的状态存储在芯片缓存中，以降低处理器的能耗。为了让该技术更实用，英特尔在至强5600中还增加了一个专用SRAM单元来保存核心状态，每个核心在关闭之前都会将其状态资料转入这个SRAM单元，恢复时再从中读取，而不再烦劳L3缓存。通过这类优化后的智能节能技术的应用，可让CPU在空闲状态时的功耗非常低，让效能比更佳。

至强5600同样支持Turbo Boost睿频加速技术，可以根据负载提升部分核心的频率并关闭其他核心，在不超过总TDP的前提下，尽量挖掘CPU的潜力。并且，该六核处理器也支持英特尔著名的HyperThreading（超线程）技术，每个核心支持两个虚拟线程，这使至强5600在相关监测软件中呈现十二核的状态。

●内存方面的改进

至强5600内置三通道DDR3内存控制器，引入了低电压DDR3内存，支持标准电压1.5V和低电压1.35V两种规格，使用低电压的DDR3内存条，如果满配12个DIMM插槽，一台服务器可以节省25W，整体功耗可节省10%左右。对服务器应用来说可进一步节约能耗，且这样的节能特性对于数据中心等密集部署环境有积极意义。

随着服务器计算能力的不断增强，虚拟化效能越来越高，内存的创新设计正成为下一代产品的关注焦点。思科最新推出的UCS通过内存扩展模块技术，可支持48个DIMM，支持的内存容量最高达384GB，至强5600在这方面进行了加强——至强5600支持单条16GB的内存条，服务器在支持18个DIMM的情况下，支持的内存总容量可增加一倍，达到288GB，这可大大加强服务器在虚拟化方面的应用需求。除此外，至强5600最低支持DDR3-1066，而非上一代的DDR3-800。

●支持AES-NI加密指令集

制程工艺的进步让英特尔的设计工程师有了更多晶体管资源预算来增加新的功能，比如在45nm制程时在处理器中增加了SSE4.1指令集，而在32nm制程的Westmere中，英特尔又新加了AES-NI（Advanced Encryption Standard）指令集，专门用来加密数据，可以解决X86处理器在加密、解密运算方面的窘境。

AES是目前最流行的加密标准，AES加密基于替代置换网络算法，因为单一的堆砌数据是非常容易被破解的，因此整个加密过程会经历多次循环。AES加密可以进行10个、12个、14个循环，对应AES-128、AES-192、AES-256规范。解密遵循相反的过程，循环次数一样，但需要解密“密钥”而不是加密的“密钥”。

AES-NI指令集用途较广，它提供了快速的资料加密及解密运算功能，可大大提高资料的安全性及保密性，处理器加入了针对AES-NI的指令集，有助于减轻加密和解密时的运算负荷。这对于数据安全和可靠性要求较高的企业应用，有非常积极的意义。在未来的服务器与商用PC上，AES-NI可大展拳脚，例如对商业客户来说，经常需要使用Windows 7 BitLocker等技术对硬盘数据进行加密保护，AES-NI就可以提高这类应用的速度。

“青出于蓝胜于蓝”的至强5600

由于2010年不是“Tock（架构年）”，至强5600和至强5500在一些基本特性上是一致的：如具备32KB指令缓存+32KB数据缓存、每个核心具有256KB L2缓存、L3缓存共享；集成三通道DDR3内存控制器，支持的最高内存规格为DDR3-1333；采用QuickPath互联架构，具有两条QPI总线，最高速率为6.4GT/s；支持超线程技术和Turbo Boost睿频加速技术等等。

虽然从架构特性上来看，至强5600只是比至强5500前进了一小步，但从技术特性上来看，至强5600仍迈出了一大步。至强处理器5600系列作为英特尔首批基于32nm制程工艺的服务器处理器，其性能比上一代产品提升最高达60%；比至强处理器5500系列有更强的性能表现，英特尔至强5600系列处理器成功打破了12项与双路服务器和工作站相关的性能世界纪录。可让CPU功耗更低，每瓦特性能更高，六核的至强5600的最低功耗为60W，四核版本的至强5600的最低功耗只有40W，更符合节能低碳的趋势。至强5600继承了上一代产品的智能计算特性和功能，可更好地满足用户在服务器部署、应用和维护中的核心需求，尤其适用于大规模数据中心、高性能计算、云计算和其他数据密集型应用环境，可在这些环境中帮助用户提高工作效率，同时更好地解决企业用户在服务器部署、应用及维护中面临的问题和挑战。

至强5600系列处理器有哪些具体的型号，都有些什a么规格呢？都是六核心的版本吗？显然不是。3月17日发布的首批至强5600系列处理器共有13款型号，有7款四核版本和6款六核版本。六核十二线程的至强5600系列包括“Xeon X5680/X5670/X5660/X5650/L5640/ W3680”，主频从3.33GHz到2.26GHz不等，三级缓存12MB，热设计功耗方面，X5680为130W，W3680为130W，低压版型号L5640为60W，其他均为95W，全部支持Turbo Boost睿频加速技术。

而四核八线程的至强5600系列包含Xeon X5677/X5667/E5640/E5630/E5620/L5630，Xeon L5609属于四核四线程的处理器，这些四核的至强5600的主频从1.86GHz到3.46GHz不等，三级缓存容量同样是12MB，热设计功耗则有130W、95W、80W、40W 4种，其中两款Xeon L5600系列低压版本都是40W，但是Xeon L5609不支持超线程和睿频加速技术。

新至强处理器掀波澜

虽然在处理器市场上，英特尔已鲜有对手，但在“钟摆”战略的自励下，英特尔仍履行了承诺，带领业界不断向前。新一代至强处理器的面世，必将在市场上掀起新一轮处理器更新换代的波澜。

●服务器市场面临变革

新一代至强处理器在提供更好性能的同时，会消耗更低的能源，帮助用户节省电费和使用成本，这对于服务器厂商的吸引力不言而喻。为此，在英特尔正式推出至强5600处理器后，IBM、HP、DELL等一线厂商都相继发布了最新的基于该处理器的服务器产品，而包括思科、富士通、甲骨文在内的多家世界级服务器及工作站系统制造商，也将在产品发布后45天内发布多款基于至强处理器5600系列的服务器和工作站产品。与此同时，多家软件提供商，包括思杰、IBM、微软、Novell、甲骨文、红帽、SAP AG和VMware等，也将为基于至强处理器5600系列的硬件平台提供软件支持。

例如，在至强5600系列处理器推出后，戴尔便在第一时间推出了9款PowerEdge刀片式、机架式与塔式服务器，3款戴尔Precision塔式工作站。它们均采用了新的英特尔至强5600系列处理器，具备戴尔生命周期管理器与戴尔管理控制台（DMC）的新增功能。戴尔宣称，这些硬件与软件解决方案可为企业客户提供卓越的管理能力，并可提供面向虚拟化、服务器整合、关键任务业务与数据库应用的强大IT平台。

同期，惠普也发布了16款Proliant G6服务器，包括采用了至强5600处理器的机架式和塔式服务器。IBM则表示将提供基于至强5600处理器的两款机架服务器（x3650 M3和x3550 M3）以及两款企业级塔式服务器（x3500 M3和x3400 M3），而宝德采用至强5600的服务器则已抢先登陆中国市场。

调查显示，全球还有80%的服务器是采用单核心（38%）与双核心（42%）的处理器，所以未来服务器的处理器更新换代的需求巨大。优先推出采用至强5600处理器的服务器，已成为服务器厂商提高自身竞争力和市场竞争力的必要条件。如何通过推出新至强服务器争夺潜在用户，成为每家服务器企业需要直面的问题，当然，除了积极利用新至强处理器带来的平台优势外，如何在竞争中满足用户的差异化需求，也至关重要。

●服务器应用更强劲

英特尔的数据表明，即使是2.26GHz的至强L5640，其性能也可与2.93GHz的X5570相当，但能耗可下降30%（X5570的TDP是95W，L5640是60W）。在至强5500发布时，英特尔给出的等效比是1∶9，即1台至强5500服务器的性能相当于9台单核心的至强服务器。以至强5500服务器替换旧的单核心服务器后，8个月可收回成本。现在，至强5600将这一数字提高到了1∶15，ROI（可收回成本）也缩减到了5个月……显然，这种种细微的变化必将对服务器应用产生重要的影响。

例如在被广泛关注的高性能计算领域（HPC），至强5600的出现很可能引发新一轮的换“芯”浪潮。这是因为至强5600和至强5500采用了相同的插槽，可以平滑地进行升级，现在使用至强5500平台的用户，通过升级BIOS就可以完美地支持至强5600。最新一期的世界HPC TOP 500榜单中，IBM的走鹃（世界上第一台Linpack超过1Pflop的HPC）被Cray的美洲豹挤下神坛，屈居第二。中国天河一号是混合架构里的No.1，在整个榜单名排第5。而随着众多的采用英特尔至强5400/5500系列处理器的超级计算机将处理器更换为至强5600，肯定将引发高性能计算机排名的新地震及性能/效能的大跃进，让英特尔的服务器处理器在HPC领域的占有量稳步上升。

而对于被广泛关注的虚拟化应用来说，至强5600新增加的AES-NI指令将有效地提高虚拟化环境下的实际运行效率。无论是至强5600还是至强7500，都在安全性、可靠性方面进一步增强，可以大大降低未来云计算时代虚拟化环境的安全风险，增加对企业用户的吸引力。

过去，由于八路服务器的设计和制造困难，售价往往比普通四路服务器高出几倍，技术也只掌握在IBM等少数几个厂商手中。而即将推出的至强7500则很可能催生新的八路服务器市场，得益于至强7500中的4个QPI接口，服务器厂商可以非常容易地通过QPI构建出一套八路系统，这也将对未来的RISC市场、小型机市场和八路服务器购入成本产生重要影响。

延伸阅读>>至强7500前瞻

随着至强5600系列处理器的现身，服务器用户的目光还进一步瞄向了即将发布的45nm制程工艺的至强7500系列（Nehalem-EX）处理器，该处理器又有何特性呢？

●八核新至尊

与面向中端双路（DP）服务器系统的至强5600不同，至强7500是英特尔高端的多路（MP）服务器处理器的代表作，它用来取代2008年9月发布的六核至强7400系列（代号Dunnington）。与六核至强7400相比，虽然至强7500处理器仍然使用45nm制程工艺，但至强7500（Nehalem-EX，内部代号Beckton）的架构发生了重要变革。最高单芯片可集成8颗核心，能够利用Hyper Threading同时处理16个线程，如果四路服务器使用至强7500的话，可以同时处理64个线程。至强7500的总晶体管数量则为23亿个，是四核心Bloomfield的3倍以上，也远高于至强5600的11.7亿个。

而从其他基本特性来看，至强7500与上一代的产品基本相同，例如处理器的一级高速缓存容量为64KB（32KB指令缓存+32KB数据缓存），二级高速缓存容量为256KB。但Nehalem-EX的每个内核都有3MB的三级缓存，每个三级缓存由总线连接起来，所以一共有24MB三级缓存容量。Nehalem-EX配备了4个QPI界面，而Nehalem-EP只有3个，桌面版本Nehalem则只有2个，更多的QPI总线可以更方便地连接更多数量的处理器。

Nehalem-EX最多支持16个DDR3内存插槽，如果使用了单条16GB的内存条，每路CPU最大支持256GB的内存。如果四路服务器都装满最大容量的内存，那么内存就可达到1TB，成为大型计算机级的英特尔64位服务器。至强7500也支持虚拟机实时动态迁移，包括Intel的VT FlexMigration Assist和VMware的Enhanced VMotion等。

●支持RAS特性

至强7500系列处理器最具看点的新特性在于支持来自英特尔Itanium（安腾）家族的“RAS（Reliability、Availability and Serviceability，稳定性/可用性/可服务性）”，及“MCA Recovery（自动校验架构恢复）”功能。

为什么英特尔要在至强7500系列处理器中引入RAS特性呢？从维基百科的解释上我们就可看出一些端倪——RAS是电脑硬件工程上的术语，最初来自IBM公司为其大型主机所做的宣传广告，强调大型主机系统的坚韧强固：稳定性（或称坚稳性）、可用性（或称可靠性）、可服务性，如今这个概念已广为人知。虽然近几年来，英特尔的X86服务器处理器架构取得了长足的进步，但由于欠缺RAS特性，让X86服务器在性能不如自己的基于RISC架构的小型机面前有些“底气不足”。随着英特尔在至强7500系列处理器中引入该特性，RAS必将让至强7500如虎添翼。

对于那些想从小型机转向X86开放平台的用户来说，性能往往不是问题，考虑更多的是X86服务器能否达到小型机那样的稳定性和安全性。为此，至强7500中引入了20多条RAS指令，RAS技术可集中解决X86服务器三个方面的问题：一是数据保护，可以诊断哪些数据出错，利用一些CRC、ECC校验来纠正错误，如果不能纠正，可以对这些损坏的数据进行隔离，以保证不影响其他数据，避免系统重启和宕机。这样当X86服务器的CPU内核或者内存I/O等出现异常状况时，系统可以只切开故障部分继续运行。二是高可用设计，包括QPI总线之间的互备和热切换、内存和CPU的热切换、故障预警机制等等，以保证系统的高可用性。三是降低系统计划内的宕机时间，包括系统分区管理技术、CPU和内存的热添加和热删除等。

Nehalem-EX还采用了高级RAS特性（MCA恢复）等一些新技术，服务器能够检测CPU、内存、I/O错误，并通过与操作系统合作进行纠正，提供更低的TCO（总拥有成本）、更高的性能、出色的灵活性，能够为服务器提供更强的容错能力和更多的正常运行时间，让Nehalem-EX也能具备32个插槽的扩展能力。

为此，英特尔表示，有了面向高端企业客户的RAS技术，至强7500系列处理器可带来更低的配置成本、更高的系统性能、更少的电费账单，并实现弹性IT环境的标准化，有利于加速从RISC平台向Intel Xeon/Itanium平台的转移。可为关键任务工作环境提供大型主机级别的可靠性和可扩展性，尤其适合高强度的多线程负载。

至强7500系列处理器究竟能为用户带来什么？英特尔（中国）有限公司服务器产品事业部产品经理顾凡的讲话或许能为我们揭示这个秘密：“Nehalem-EX最大的看点并不只是高达3倍的性能提升，而是在可靠性和可扩展性方面的增强，这些改进使得Nehalem-EX会催生一个全新的八路及八路以上X86服务器市场，并将在数据库、ERP等关键业务领域和大规模虚拟化整合领域冲击传统RISC阵营。”

编后：性能更高、功耗更低、可靠性更高、效能更出色、核心更智能，英特尔新至强处理器带来的优势将在未来逐步显现：它一方面能够帮助用户显著提升数据中心的计算密度，在同样的空间和同样的功耗下获得更强的计算能力；另一方面也能在提高企业的IT系统利用效率、可靠性和可管理性的前提下，让IT技术人员能从日趋繁杂的服务器及数据中心运维工作中解放出来，将更多的时间和精力投入支持企业业务的拓展。为此，英特尔公司副总裁Kirk Skaugen表示：“英特尔新至强处理器必将成为主流计算环境的关键组成部分，它在性能、服务器虚拟化和功耗方面的改进，将有助于提高从数据交易到医疗成像等多种应用的工作效率，并让IT经理们充满信心、高枕无忧。”这绝对不是自夸之辞。