开创“芯”世界,IBM Power7全解析

企业观察

当普通用户还沉浸在32nm酷睿所带来的快感时,前不久,IBM在美国纽约正式发布了被认为将成为“经典”的强大处理器——Power7。Power7处理器拥有8个内核,每个内核可运行4个线程,总的可同时运行32个线程,它成为高端服务器CPU的新王者。Power7不仅会成为UNIX服务器市场的新利器,也将为IBM在千万亿次HPC市场中重振雄风。

UNIX服务器CPU市场现状

2005年惠普推出自己的最后一颗RISC架构的处理器PA-RISC 8900,SGI终止了Origin服务器产品线和其MIPS芯片的研发之后,在针对大型机和小型机的UNIX服务器、高端服务器CPU市场上,便成了IBM的Power系列处理器、Intel的安腾系列处理器、Sun的UltraSparc系列处理器的“三国演义”。

●IBM的“Power”不是电源、也不代表能量,而是Power Optimization With Enhanced RISC(增强精简指令集计算机性能优化架构)的简称,是IBM服务器、工作站和超级计算机采用的主力处理器。IBM Power处理器最早源于RISC处理器801 CPU,它在1990年被RISC System/6000 UNIX工作站(现在称为eServer和pSeries)采用,IBM的Power系列处理器包含Power1、Power2、Power3、Power4、Power5、Power6,以及前不久发布的Power7。

●Intel的安腾(Itanium)系列处理器一直定位于高端服务器市场。安腾系列处理器构建在IA-64之上,是Intel专门用在高端企业级64位计算环境中、对抗基于IBM Power、Sun UltraSparc系列产品的利器,其应用的领域包括大型数据库、电子商务安全处理、计算机辅助机械工程及高性能科学计算等。安腾系列处理器包含安腾1、安腾2系列产品,最新的安腾9300(Tukwila)系列处理器也于前不久发布。

●Sparc是1987年Sun和Ti公司合作开发的RISC架构处理器,它具备良好的可扩展性,为Sun赢得了在高端微处理器市场的应有地位。新一代的UltraSparcT2处理器有8个核心,可以同时处理64个线程,有5.03亿个晶体管,核心大小342平方毫米,由Ti负责制造。

在过去的一年里,在UNIX服务器市场活得最“滋润”的当数IBM。Sun被Oracle(甲骨文)收购,这让其精气神短期内大减,而惠普倚仗的安腾处理器几年数次跳票,让这个信心满满的巨头也感到有心无力,IBM则相对顺风顺水,在强大的Power6支持下,开疆拓土,连连从Sun和惠普手里抢夺地盘。虽然UNIX服务器市场整体表现低迷,但IBM通过不断的努力,顺利地超越了曾在UNIX服务器市场长期占据主导地位的Sun和惠普:目前IBM占据了UNIX服务器市场4成的份额,惠普占了3成,Sun占2.5成。

进入2010年后,IBM和Intel相继发布了最新的Power7和安腾9300处理器,业界都期望这种更新换代能给UNIX服务器市场注入新活力。而凭借更高规格的参数及强劲的性能,Power7的光芒在近期压制住了安腾9300,估计Power7会帮助IBM彻底确立在UNIX服务器市场的绝对领导地位。

企业3-image003.jpg
Power7的八核架构

Power处理器二十年“磨剑”

企业3-image001.jpg

“温故而知新”,回顾Power处理器的发展历史,会让我们更真切地感受到该处理器的强大。1990年,IBM推出了基于RISC系统的AIX V3,它集成了80万个晶体管,这就是后来被称为Power1的处理器,它主要用于火星探测计划。1993年9月,IBM发布了66MHz的Power2处理器,每个芯片集成1500万个晶体管,首先应用于RS/6000系统,被欧洲粒子物理学实验室采用,采用该芯片的著名的“深蓝”超级计算机曾因击败国际象棋大师卡斯帕罗夫而“一战成名”。

1998年10月,IBM推出了Power3处理器,该处理器统一了Power2架构和Power1架构,采用64位架构,主频达到了450MHz,最高运算速度可达每秒200万次,比“深蓝”还快一倍多。2001年,IBM推出当时世界上最强大的UNIX服务器——eServer p690,它拥有1000多个先进的Power4处理器,集成了多项主机技术,能够完成更复杂的运算任务。eServer p690被公认为是第一种“单片服务器”,由两个1GHz以上的处理器、一个大带宽系统交换开关、一个大容量内存高速缓存和I/O接口组成,依靠eServer p690,IBM在2001年第四季度以26.9%的市场份额赢得了全球UNIX服务器市场的冠军宝座。

2004年5月,IBM推出了新研发的Power5处理器,这是一款新的64位处理器,它除了在性能方面得到明显提高外,在可扩展性、灵活性和可靠性方面也有所加强。Power5芯片具有2.8亿个晶体管,比最初的Power4芯片多1亿个,芯片面积为389平方毫米,包括2313个数据I/O和3057个电源I/O。增加了并发多线程能力(SMT),可将一个处理器转变为两个处理器,从而允许一个芯片同时运行两个应用,由此大大降低了完成一项任务所需要的时间。一个Power5系统可支持多达64个处理器,而从软件运行角度来看,就像是128个处理器在工作。

2007年5月,IBM推出了其“有史以来最快的微处理器”Power6,最高主频达到了惊人的4.7GHz~5GHz,比Intel最快的处理器主频高出近1GHz。Power6处理器采用65nm制程工艺,集成多达7.9亿个晶体管。与Power5相比,Power6不但主频翻了一番多,多达8MB的二级缓存是原来的四倍,三级缓存也有32MB。采用Power6的服务器的性能比上一代产品提高两倍,而功耗几乎维持原来的水平,目前Power6仍是高端服务器市场的主力军。

IBM Power7处理器全解析

科技创新是推进IT产业不断向前发展的原动力,在处理器领域更是如此。随着在处理器技术研发和设计方面都拥有众多创新成果的IBM推出Power7,业界再度为之侧目,Power7有何特点呢?

Power7处理器采用了IBM的45nm SOI铜互联制程,高端的Power7处理器有8个核心,晶体管数量达到了12亿,核心面积567平方毫米。Power7处理器的每个核心具有32KB L1指令缓存和32KB L1数据缓存,每个核心支持4个同步多线程(Power6只有两个),每个核心具有256KB L2缓存。此外,Power7处理器具有32MB片上eDRAM作为共享的L3缓存,每个核心平均有4MB。在Power7中,虽然每个内核都拥有自己的L3缓存区,但也可通过智能共享缓存的方式按需访问其他核心的缓存区,这不仅可以让带宽增倍、减少延迟,也可减少对晶体管的占用,从而减少芯片面积、降低功耗。

Power7处理器提供了两个DDR3内存控制器,每个控制器支持4个DDR3通道,支持DDR3-1600内存,提供100GB/s的内存带宽,每个通道的速度为6.4Gbps,最大可以支持32GB(使用两根16GB内存条)内存,这让每颗Power7处理器最大可以支持256GB内存,这明显比上一代的DDR2内存控制器先进。并且,IBM为新内存附加了一项重要的技术——Active Memory Expansion,通过内存压缩,让软件可用的内存量最高两倍于实际物理内存。IBM表示,通过使用该技术,SAP(企业管理解决方案)软件可用内存量比系统实际内存可多出50%,可处理业务量将增加65%。

作为8核处理器,每个Power7处理核心的最大特点是具有12个执行单元,这12个执行单元是:2个整数单元(Fixed-Point Units,FPU),2个加载存取单元(Load/Store Units,LSU),4个双精度浮点单元(Double-Precision Floating-Point Units,FPU),1个向量/标量扩展浮点单元(VSX),1个十进制浮点单元(Decimal Floating-Point Unit,DFU),1个分支单元(Branch Unit,BRU),1个条件寄存器单元(Condition Register Unit,CRU)。上一代产品Power6采用顺序执行结构,可以获得较高的运行频率。而Power7则采用了乱序执行的结构,虽然在频率上略有降低,但可获得更好的执行效率。正是凭借这种更强大的执行能力,让Power7具有更强大的多线程能力,这更符合目前的虚拟化潮流。

企业3-image005.jpg
Power7每核心的指令通常由左下开始顺时针执行到右下
18-行业之道-3.jpg

●智能化功能不输Tukwila安腾

总之,具有八个核心、32线程、32MB缓存的Power7具有了比Power6处理器翻番的性能,可以轻松打造32路256核1024线程的大型机。即使与Intel最新的四核Tukwila安腾处理器相比,Power7的性能指标也领先一些,在制程工艺方面,英特尔为Tukwila安腾选择的仍然是65nm制程工艺,而IBM则抢先一步采用了45nm制程工艺。Power7在很多地方都有显著提高,比如改进的能效、升级的线程能力、资源动态分配和大幅提高的多路吞吐能力。

而在现代处理器重点发展的智能化能力方面,Power7也不输于Intel的最高端产品Tukwila安腾系列。并且Power7具备智能核心、智能线程、智能缓存、智能功耗、智能内存技术等一系列的智能化功能,这让Power7处理器变得更强大。例如,Tukwila安腾处理器可以通过Turbo Boost技术提升9.8%的时钟频率,而Power7的高端型号Power Systems 780也支持类似技术——TurboCore和MaxCore。TurboCore和MaxCore是两种颇具灵活性的应用技术,无论是在需要强大的单核处理性能、大内存支持的场合,还是在需要多线程和并行处理性能的场合都很有用。因为TurboCore可关闭Power7处理器的部分核心,并把分配给这些核心的4MB L3缓存分配给没有关闭的核心,同时提高工作核心的主频,使它们具有更强大的处理性能。而顾名思义,MaxCore则是一种与TurboCore功用“相反”的技术,它可更好地为系统提供多核心、多线程应用的能力,可更好地应对基于互联网的大量并行工作负载的需求。

此外,IBM在Power7中引入了一种新的功能——SMT4智能并发多线程(Intelligent Threads),它可根据工作负载要求设置不同的多线程模式。对此,可让系统自动选择,也可以由管理员进行手动设置。在使用多线程时,可提高Power7的并行吞吐量,使用单线程,则可以提高Power7的计算性能。比如,数据库类应用往往需要非常快的处理器,以便用最高速度来处理交易,而Web负载则往往要将Web请求拆分成多个部分来并行处理。如需要监控数百万户家庭的用电量时则优化为多线程处理,而当需要实时处理数据库业务时则对较少线程高速运算进行优化。

Power7系统还为虚拟机应用进行了优化,每个处理器核心支持10个虚拟机镜像。目前的8路64核系统可支持单系统最高640个虚拟机同时运行,今年内,IBM还将推出32路256核的Power7系统,最高同时运行1000个虚拟机。(小谢)

企业3-image006.jpg
Power7将成为IBM在高端服务器市场上冲锋陷阵的利器

编后>>

具备一系列智能化技术的Power7被称为IBM Power架构十年来最为出色的产品,不同的服务器可针对不同的应用负载而设计是Power7最大的特点。促使IBM Power7抢先推出的原因很多,如甲骨文对Sun的收购、Intel四核Tukwila安腾处理器和Beckton八核Nehalem-EX处理器的推出、AMD 12核Magny-Cours处理器的推出等,都需要IBM抢先推出重头处理器产品进一步稳固自己的地位。而在这些新产品的推动下,2010年的高端服务器市场注定将变得更精彩。Power7适用于多种领域,比如2U/4U机架和刀片系统、中高端服务器、超级计算机集群等等,在Power7的强力助阵下,IBM有机会在这些领域进一步大展拳脚。各大IT巨头为此磨刀霍霍,高端服务器市场争夺战的帷幕正慢慢拉开。