“核战”升级——解析AMD“马尼库尔”皓龙6100

企业观察

3月30日,AMD在美国正式发布了拥有12个内核的代号为“Magny-Cours(马尼库尔)”的超级处理器,并将它命名为皓龙(Opteron)6100系列。12个内核!让人惊讶的数字,当大多数的普通用户还在使用双核处理器的电脑时,抬头眺望世界,原来X86处理器的内核数量“眨眼间“就进入了两位数的时代。

14-qy1-01.jpg

12核的诱惑,皓龙6100全解析

以前AMD推出的三代服务器处理器,皆采用了世界知名的大城市来命名:如2007年9月10日AMD发布的K10架构65nm制程的“巴塞罗那(Barcelona)”4核Opteron处理器;2008年11月AMD发布的采用45nm制程的4核处理器“Shanghai(上海)”;2009年6月1日AMD发布的“Istanbul(伊斯坦布尔)”6核处理器。

AMD新的12核处理器采用了“Magny-Cours(马尼库尔)”这一名称,这显然并非一个知名的城市。据了解,“Magny-Cours(马尼库尔)”是一个F1赛道名,该赛道位于巴黎南方约240公里的Nevers市郊,是孕育法国赛车手的摇篮,它是拥有高速直路和多条弯路的赛道,令车队在调校赛车时要面对很大的困难。AMD将新处理器命名为“Magny-Cours(马尼库尔)”,显然希望能表达出该处理器不仅具备像F1赛车的极速,还能够满足不同环境下用户对处理器的苛刻需求,而且也具备出色的效能比。除此而外,细心的读者也会发现,其实“Magny-Cours”和英文“Many-Cores(众核)”无论字形还是发音都近似,或许这也是AMD做出如此决定的原因之一。

●“仰视”12核服务器处理器

在Intel的至强处理器刚步入8核时代之时,AMD的皓龙便向我们展示了12核处理器的魅力。皓龙6100系列是怎样从前代的4/6核跃变成8/12核的呢?“Magny-Cours”利用可在一个封装匣里装入两个CPU核心的MCM(Multi-Chip Module,多芯片组件,可将多块半导体裸芯片组装在一块布线基板上)技术,在一个处理器内同时内置两个6核或4核处理器核心,这样核心数量就可达到12个或8个。所以可将皓龙6100看成是由两个“Istanbul”(伊斯坦布尔)核心封装在一起的新一代处理器。

这也让“Magny-Cours”核心集成的晶体管数量达到了19亿个,远高于上一代的9.4亿个以及至强5600的11.7亿个晶体管。由于是封装两颗核心的非原生架构,所以皓龙6100系列处理器在外形上也呈长方形。

而为了让两个CPU核心之间能直接连接,AMD为每一个单独芯片提供了双通道DDR3内存控制器以及4个HyperTransport 3.1总线(简称HT3.1)连接——被封装在一起的两颗“伊斯坦布尔”核心原先各具有3条HT接口,各自新增加的一条作为处理器之间的通信,整体来看,12核CPU对外的HT总线条数也是4条。因此数据能够在四路服务器系统中的任意两个处理核心之间传输,而其直连总线速度也从上一代的4.8GT/s升级为6.4GT/s,可实现102.4GB/s的I/O总带宽。

●“老树新葩”的皓龙6100

在制造工艺上,皓龙6100系列处理器仍沿用了上两代产品采用的45nm SOI工艺。虽然与Intel的32nm工艺相比,应用Low-K电介质、多重增强晶体管应变技术以及沉浸式光刻技术的工艺已不算先进,但作为一项久经考验的成熟工艺,它可以最大程度地保证AMD新CPU的良品率。

一级缓存每核心64KB+64KB;每个核心搭配512KB二级缓存(8核共4MB二级缓存、12核共6MB二级缓存);每六个核心共享6MB三级缓存,整个处理器共配备总计12MB的三级缓存,明显大于上一代产品的6MB三级缓存。此外,皓龙6100的内存系统也从DDR2升级到DDR3,内置四通道DDR3-1333内存控制器,每个通道支持最多三条内存,每个处理器可支持最多12条内存,比起上一代的双通道DDR2-800是一个飞跃。

皓龙6100系列处理器同样具备上一代处理器就已具备的HT Assist技术。HT Assist是AMD所采用的一种探测过滤器技术,它在每颗处理器上保留1MB三级缓存作为一个目录。这样,虽然三级缓存只剩下了5MB,但省去了大量的探测传输,可大大降低延迟、节省带宽。对于四路系统来说,内存带宽因此可以多出60%,它对四路系统和八路系统有至关重要的作用。

●效能和性能双提升

上一代“Istanbul(伊斯坦布尔)”6核处理器的最高主频为2.8GHz,而目前发布的拥有DCA 2.0(第二代直连架构)的“Magny-Cours”处理器的最高主频只有2.3GHz(12核)/2.4GHz(8核)。主频的降低会不会带来性能的降低呢?AMD提供的相关测试数据表明,这样的担忧是没有必要的。尽管皓龙6100系列处理器的主频有所降低,但是和当前的皓龙处理器相比,12核处理器“Magny-Cours”依旧能够带来不错的性能提升,其更大的缓存和更多的处理器核心可使服务器系统运行得更快;有着数量众多处理核心的服务器系统在虚拟化环境中能够更快速地处理任务,此外还能让服务器“寄宿”更多的虚拟机。单纯靠提高主频来提升性能,与更注重能效比的现代处理器发展思路已格格不入,所以在主频战后,无论是Intel还是AMD都偏重于靠增加核心数量、降低能耗和提高能效比来实现更佳的处理器性能。

除此之外,皓龙6100系列处理器支持多种节能技术,支持超低电压DDR3内存、第二代虚拟化技术AMD-V 2.0、第二代节能技术AMD-P 2.0(包含PowerNow!、Smart Fetch、C1E等技术)。AMD-V 2.0中增加了I/O虚拟化功能IOMMU、支持异构的虚拟化迁移等技术,可从芯片组硬件层面提升整个系统虚拟机的输入/输出性能。AMD-P 2.0则延续了APML(Advanced Platform Management Link,远程电源管理界面)功能,可以让系统管理不用进入主板的BIOS设定,通过远程操作就能够控制设备的电源,让管理员能够在线设定CPU主频的界限、监视系统功耗、修改电源参数等等。而基于传统的PowerNow!技术可通过不同的频率切换获得节能效果,并平衡能耗和性能的关系;Smart Fetch技术可以暂停处理器中的某个闲置核心;CoolCore技术可以关闭处理器不工作的部分,起到节能降温的作用。在C1E模式之下,核心时钟关闭,一级缓存和二级缓存中的所有数据都转移到三级缓存中,所有的HT总线连接转入低功耗状态。

在这些能效技术的支持下,12核的Opteron 6164 HE 1.7GHz/65W满载功耗也不过225W,只比6核的Opteron 2425 HE 2.1GHz/55W增加了4%,实现了效能和性能的双提升。

●采用Socket G34接口

首批皓龙6100系列处理器包括5款8核心和5款12核心产品,主频为1.7 GHz~2.3GHz,其中带有“HE”后缀的是65W节能版(低功耗处理器),带有“SE”后缀的是105W高性能版(高性能处理器),没有后缀的则是80W标准版。由于核心的倍增,该处理器的封装尺寸也大增,外形更是由传统的正方形变成了长方形,这让原先的Socket F接口(1207个脚位)已不能满足该处理器的连接需求,为此AMD随同皓龙6100系列处理器推出了采用Socket G34接口的全新Maranello(马拉内罗,法拉利总部)主板平台。

Socket G34同皓龙6100系列处理器一样,最引人注目的就是其长方形的外形,Socket G34共有1974个脚位,比Socket F接口多了767个脚位,能够给多通道DDR3内存以及多条HT3.1总线带来更大的数据传输空间。其配套的Maranello平台则采用SR56x0系列北桥芯片(含SR5690、SR5670、SR5650等型号)+SP5100南桥芯片。

14-qy1-02.jpg
12核的“Magny-Cours”由两个“Istanbul”6核心处理器封装而成
14-qy1-03.jpg
“马尼库尔”的架构示意图
14-qy1-05.jpg
首批皓龙6100系列处理器

12核处理器带来的影响

AMD将行业用户分为主流用户和高端用户,而作为全球首款12核的X86服务器处理器,代号为“Magny-Cours”的皓龙6100系列处理器主要定位于高端的4路、8路服务器市场,以及双路服务器平台中的高端市场,让现有的4路系统可提供48个核心的强大运算能力。皓龙6100以其多核、具有先进的虚拟化和高效能的特点满足了企业用户和苛刻的数据密集型工作负载的需求,减少了服务器系统对于数据中心的占用面积和软件许可证成本(系统或软件厂商一般按照处理器个数收取基本的许可证费,而不是按照芯片上的内核数量收费)。

随着皓龙6100系列处理器及相关平台的推出,可以让AMD在新规划的高端市场中,充分满足行业用户对云计算、虚拟化(CPU内核数的倍增可以支持更多的虚拟机)、高能效比(在处理大量实际的负载时表现出更高的性能)、计算密度和性价比的需求,以缓解AMD长期以来在这方面得分较少的状况。通过该新型处理器,行业用户可以更好地体验到运转效能加倍、优化的处理器管理能力与低总体营运成本的好处。在任何严苛的工作环境下,行业用户均可获得卓越的整体营运绩效、最高的运转绩效与最低整体营运成本,皓龙6100系列处理器可为行业用户提供可靠性、可用性和安全性能。

在以“核心论英雄”的时代,12核处理器的出现对行业用户心理的潜在影响力巨大。皓龙6100系列处理器的推出,可让AMD保持对Intel高端服务器处理器的竞争态势。与同样使用45nm制程工艺的8核至强7500相比,皓龙6100的物理核心数量领先,这可在一定程度上防止X86服务器处理器市场出现“一家独大”的现象,更何况皓龙6100具备一定的低成本优势。

目前主流的主板厂商和服务器厂商已纷纷表示将推出基于皓龙6100处理器平台的服务器产品,为需要高密度和高扩展能力的企业用户开发新的8核和12核服务器平台解决方案,为中小企业、大企业和世界级科研机构提供高度可定制的解决方案。其中AMD、华硕、技嘉、微星、神达(MiTAC)等服务器主板厂商已推出或明确会推出支持皓龙6100平台的新主板。

编后>>

最近Intel和AMD争锋相对地推出了各自的高端服务器处理器,这不仅预示着服务器四核时代即将结束,也标志着HPC(高性能计算)市场开始向X86处理器“低头”。这也预示着高端处理器已由“多核(MultiCores)”时代向“众核(ManyCores)”时代发展,虽然有分析师指出:“决定芯片优劣的关键是性能,而不是核心数”,但很多时候“人海战术”仍是决定胜利的主要因素,这种趋势不可阻挡。多年以后回头看,大家或许会发现,皓龙6100系列处理器将是此中颇具代表性的一款产品,它率先将X86服务器处理器的物理核心数带入了两位数。

对于未来的高密度和高负荷企业计算环境以及虚拟化、云计算等新领域,皓龙6100系列处理器都将有机会在这些高性能计算应用领域展示出多核心优势。皓龙6100处理器的推出也有利于继续保持X86服务器市场的竞争活力,不仅可支持企业业务的拓展,也能起到很好的承前启后的作用,为下一代具备更多核心的32nm高端服务器处理器的推出扫清障碍。至少对于行业用户而言,都喜欢看见Intel和AMD之间这种充满活力的对战!