64位Opteron处理器横空出世

整机外设

  4月22日或许只是一个普通的日子,但对AMD公司来说却有着划时代的意义,这一天,AMD终于如期推出了首款64位K8系列的处理器(开发代号为Hammer)──面对企业级服务器市场的Opteron(图1)。AMD作了英特尔多年的强劲对手,但都是在桌面处理器市场。对于至强和安腾所针对的服务器市场,AMD尝不到半点甜头,Opteron处理器是否会让这个局面有所改观呢?

  初识Opteron

  AMD Opteron系列处理器采用0.13微米制造技术,集成64KB一级指令缓存,64KB一级数据缓存,1MB大容量的二级缓存,双通道DDR内存控制器和Hyper Transport控制器。Opteron处理器支持DDR200、DDR266和DDR333内存,Hyper Transport单元最大支持3条通往I/O的连接,总带宽可高达19.2GB/s。目前Opteron系列处理器有三种型号,分别是最低端的Opteron 100系列、支持双处理器的Opteron 200系列和支持8处理器的Opteron 800系列。

  仅从上面的指标中很难对这款处理器的性能有一个直观的感受,既然是划时代的处理器,它的优点何在呢?现在我们就来仔细看看Opteron的过人之处。

  兼容32位运算的64位处理器

  在64位平台上,英特尔的基于IA-64架构(IA-64架构指的是一种处理器架构,这种架构具有64位内存寻址能力,采用显式并行指令计算技术,编译器在保证并行处理指令时可以更加有效,代表产品是安腾处理器)的产品已经推出了一段时间。在这种64位架构上,不能直接运行以前的32位架构的软件(运行32位应用程序时须在模拟方式下运行),因此转移到64位意味着必须抛弃过去几十年积累的软件资源,从头再来,这样一来,综合成本将非常惊人。而随着互联网、数据库、多媒体应用、数据加密等应用的逐步普及,应用环境对服务器与客户端的计算能力不断提出新的要求,以32位技术为基础的x86体系已经开始成为企业计算发展的障碍。在这样的环境下,企业迫切需要一个能够兼容32位软件的低成本64位平台,如今这个愿望终于由Opteron处理器实现了。

  AMD的64位架构名称叫x86-64。与IA-64不同,x86-64能同时处理32位和64位软件指令,用户还可以在不改变硬件的前提下升级为64位系统。微软也表示将在Opteron推出的同时发布对应的Windows Server操作系统软件,无疑这将对AMD发展服务器市场起到一个极大的推动作用。

  革命性的内存控制器

  当运算系统具备了高效能的处理器时,如何让处理器充分发挥出应有的性能则是另一个关键问题。在处理器的运算过程中,与它直接进行数据交换的就是系统的内存控制器。在处理器和内存控制器之间的数据带宽,是长久以来被众多用户所关注的环节。与以往的处理器结构不同,Opteron微架构率先将内存控制器集成在处理器内部(如图2),从而从根本上革新了基于x86处理器访问系统内存的方式,在降低了访问延迟的同时,也极大地提升了处理器可用的带宽。

  Opteron集成了一个双通道的DDR DRAM控制器,最大可以支持8个DDR DIMM(每通道4个)。最初版本的内存控制器设计可以支持PC1600、PC2100和PC2700,如果以PC2700为例,处理器的有效数据带宽最大可以达到5.3GB/s,集成内存控制器能够显著地降低内存延迟,而且随着处理器频率的提高会使延迟进一步降低。

  对于一些需要应用多处理器系统的高端环境,Opteron处理器的内置内存控制器将能够提供更为实际的效果。以往的多处理器系统都采用共享总线的方式,也就是说,当系统中拥有两个处理器时,其连接内存控制器的数据总线只有共享的那一条。而在Opteron中,由于每个处理器都拥有自己的内存控制器,这样就不会出现多处理器在进行运算时争夺对内存总线的控制权的情况。以一个4处理器的系统为例,在这个多处理器系统中,能够支持多达32个DIMM(每个处理器连接8个),在使用PC2700内存时可以提供高达21.3GB/s的系统有效带宽。

  更多亮点设计

  与把内存控制器集成到处理器内部改进了内存带宽的性能类似,通过把Hyper Transport技术集成在Opteron里,运算平台提供了处理器和I/O子系统之间更为出色的数据连接带宽。Opteron处理器采用Hyper Transport总线取代目前通行的FSB前端总线,Hyper Transport总线连接处理器和北桥芯片组,工作频率为800MHz,采用双向数据传输模式,单向带宽3.2GB/s,总带宽6.4GB/s,其性能要远远领先于目前应用在各类系统中的其他数据总线。

  与第七代微处理器架构相比,Opteron拥有更为出色的TLB结构(translation look-aside buffer,转换表缓冲区),Opteron增加了TLB入口的数量,通过把全局历史计数器中双峰计数器的数量增至16K,Opteron处理器加强了分支预测功能来提高性能,特别是在较大的工作负荷时更能体现出优势。在高负荷运算中,数据的正确性对运算效率的提高也是重要的一环。Opteron通过对ECC(Error Correcting Code,纠错编码)的支持,处理器可以针对L1数据缓存、L2数据缓存以及DRAM,对所有ECC保护阵列进行硬件排错处理。

  谁来撑起Opteron

  Opteron处理器在问世之初,仅仅只有AMD自家的AMD 8111/8131/8151芯片组支持,而接下来,VIA、NVIDIA和SiS也都将推出支持K8处理器的芯片组K8HTA、nForce3 Pro和SiS755。另外主板厂商将推出一些屏蔽Opteron内置内存控制器的功能的产品,转而采用芯片组北桥内建的内存控制器,以增强Opteron对内存支持的灵活性。值得一提的是,AMD在K8时代开始采取和英特尔相同的做法,Opteron的针脚和Athlon 64将不再兼容,前者为Socket 940结构,后者为Socket 754结构,这也从一定程度上表明了AMD要将Opteron和Athlon 64划清界限,两者的价格和性能都会保持较大的差距。

  结语

  由于Opteron处理器主要是针对服务器市场,更多消费者关注的是面向主流市场的Athlon 64。不过,大家也可以从Opteron身上看到Athlon 64的影子。根据AMD官方测试成绩,Opteron处理器在x86纯32位应用软件测试当中,已经领先英特尔Northwood内核的Xeon(至强)处理器,这和目前Athlon 64处理器工程样品在纯32位应用程序测试当中,落后于Pentium 4处理器的情况,形成鲜明对比。不过Athlon 64 2800+处理器在大多数3D游戏测试当中,要领先Pentium 4 2.8C GHz处理器。另外,Athlon 64 2800+处理器的工作频率为1.6GHz,Athlon 64 3100+处理器的工作频率为1.8GHz,Athlon 64 3400+工作频率为2.0GHz,这三款处理器将在9月份发布。Athlon 64将采用0.13微米SOI(硅绝缘)制造技术,集成1MB二级缓存,Athlon 64还将在转产0.09微米制造技术之后,推出Athlon 64 3400+以上的型号。Opteron处理器是K8系列的第一款产品,不过也只有当Athlon 64批量上市的时候,K8时代才算是真正的来临了。