Intel的新武器——Intel下一代处理器架构分析(上)
技术大讲堂
随着贝瑞特的当众一跪,“NetBurst架构可以让CPU的工作频率提高到10GHz以上”的预言也终于在3.8GHz前划上了句号。在双核处理器没有达到预期效果的尴尬情况下,为了改变当前的被动局面,Intel在2005秋季IDF(英特尔开发者论坛)上作出了重大决定,将对桌面平台、移动平台和服务器平台处理器进行架构上的统一,推出全新的处理器架构!
Intel遇到了麻烦
自2000年11月20日诞生以来,NetBurst架构伴随着Pentium4的发展而不断成长,一路走过了0.18μm和0.13μm制程,并步入了90nm的“纳米”时代。20级的超长流水线(Pipeline)使得Pentium4的频率在短短4年时间内从1.4GHz一路飙升到3.8GHz,并且导入了SSE3、HTT、EM64T和双核心等“与时俱进”的先进技术。超长流水线为NetBurst带来了更高的频率,但同时也使得分支预测失败后流水线指令清空和重新加载所需要的周期大为延长,导致处理器运算性能的提升并没有频率的提升那般明显。
尽管如此,Intel还是在Pentium4与Athlon XP的竞争中占了上风。2004年2月,Intel推出了同属NetBurst架构的Prescott核心,其流水线长度被史无前例地提高到31级,希望借此获得接近4GHz的高频率。虽然Prescott核心在上一代核心(Northwood)的基础上改进了许多(比如增加了二级缓存的大小),但是在同频率下仍然不是上一代产品的对手。由于流水线的增加,处理指令的步骤也随着增加,消耗的电能也增加了,加上处理器工作频率的提升,这就导致处理器出现功耗过高的情况。
为了缓解Prescott核心Pentium4进一步带来的效率低下的问题、增强自身产品的竞争力,Intel在今年年初引入了双核心处理器Pentium D。根据Intel微处理器研究实验室高层的说法,如果继续开发单核心架构的Tejas,处理器的芯片面积会比Prescott的增加90%,而多任务性能则仅有40%左右的提升。如果开发多核心架构的Smithfield,其芯片面积同样是增加90%,但是多任务性能却比Prescott提升近一倍,单任务性能也有一定幅度的提升。由于双核心处理器在并行处理能力上有所增强,因此其工作频率允许有一定幅度的降低,从而将功耗控制在一定范围内。正是这样的原因使得Intel最终选择了双核心作为Prescott核心后一阶段的发展方向。
在Intel没有正式发布双核心架构以前,人们一直认为将两块Dothan核心集成起来是制造双核心处理器的最好选择,因为它具备了高性能与低功耗两大优势。但是Intel在2005春季IDF上正式发布的Pentium D让人大失所望,该处理器采用了将两颗Prescott核心集成的方式。根据国外著名硬件网站Aanadtech对Pentium D进行的功耗测试来看,当CPU满负荷运行时,Pentium D 2.8GHz的功耗达到了244W,而其对手Athlon64 3500+(2.2GHz)的功耗只有143W,足足多出了103W!
探究Pentium 4与Pentium M的效率
Pentium M是由Intel在以色列海尔法的设计团队开发的,这款专为移动平台设计的产品功耗远低于Pentium4,但性能毫不逊色。虽然在前端总线、接口方面与Pentium4类似,但Pentium M实际上是在Pentium Ⅲ体系的基础上开发而来的,它最大限度地榨取了Pentium Ⅲ的剩余优势。
Pentium M的流水线为12级,这样一个较低的流水线数目保证了该产品在执行指令时候的高效性和低功耗性。另外,Pentium M吸收了NetBurst架构的三大研究成果:第一,引入Quad-Speed四倍速前端总线技术,有效地增大了数据流量;第二,引入Mikro-Op-Fusion堆栈管理技术,大大改进分支预测(Branch Prediction)的效率;第三,引入Enhanced Data Prefecher (加强数据预取)和Enhanced Register Data Retrieval (加强记录数据重获)两项技术,前者可以提高缓存的命中率,而后者能进一步准确找出分支预测出错的地方,使运算不必重新开始。
在缓存方面,Pentium M拥有64KB一级缓存,指令与数据部分各占32KB。在缓存读写模式上,Pentium M没有采用Pentium 4的Write-Through(直通写入)模式,而是采用了Write-Back(回写)模式,具有很高的效率。而且Pentium M的1MB/2MB二级缓存均采用低功耗设计,在任何一个时间段内只有32KB容量处于激活状态(消耗电能),其余部分的功耗几乎可忽略不计。
总而言之,较短的流水线设计、低功耗缓存、源自NetBurst架构的先进成果及制造工艺,使Pentium M的性能始终与同时代的桌面处理器保持同步。到目前为止,Pentium M家族的旗舰产品是主频2.13GHz、533MHz FSB的770处理器,它与3.46GHz的Pentium4 XE处理器性能相当。不过,前者的最高功耗只有27W,远低于后者的135W!显然,无论从哪个角度来看,Pentium M在架构上都优于Pentium4,在此基础上开发新一代产品无疑是十分明智的。不过,鉴于Pentium M在架构上的潜力已接近极限,性能与功耗之比很难有较大的提升,因此,Intel决定推出革命性的Parrot架构,而Merom、Conroe和Woodcrest就是基于这个架构的产物。
Merom/Conroe/Woodcrest的特点
虽然我们当前所使用的处理器都属于IA-32体系,但它们基于不同的核心架构,比如Pentium(奔腾)采用了代号为P5的架构、Pentium Pro、Pentium Ⅱ和Pentium Ⅲ采用了代号为P6的架构、Pentium 4和Pentium D则采用了NetBurst架构、Pentium M又源自Banias核心。Merom、Conroe和Woodcrest的推出将使处理器的架构得到统一,这种做法的好处在于,能够进一步集中人力资源和物质资源开发出优秀的处理器产品。
Merom、Conroe和Woodcrest进一步整合了Pentium4与Pentium M的优势,“效率至上”(即性能功耗比,Performance/Watt)思路取代了使用多年的“频率至上”理念。在“效率至上”思想的指导下,下一代处理器流水线长度为14级,相对于Prescott的31级有明显降低,甚至比Athlon 64浮点流水线的17级还少了3级!流水线的缩短对处理器功耗的降低有很大的帮助。虽然流水线的缩短给处理器工作频率的提升带来一些困难,但对Intel来说,频率已不再是重点,芯片性耗比指标才是第一要务。
在下一代处理器中,我们不会再看到Hyper Threading(超线程)技术的身影,这是由新处理器的高效结构决定的。当初Pentium4流水线过长,利用效率低,造成执行管线资源大量浪费,引入Hyper Threading技术可以利用被闲置的资源,提升处理器性能。但下一代处理器的流水线是“短流水线”设计,资源浪费问题没有Pentium4那么严重,而且使用Hyper Threading技术会大大增加程序编译的难度。
Merom、Conroe和Woodcrest将继续采用双核心架构,但与现有的双核心相比,它们显得更加成熟。现有的双核心架构仅仅是将两颗独立的Pentium4封装在一起共享一条前端总线。这种处理器缺乏高效率的任务指派单元、两个核心无法进行通讯、二级缓存必须经常与内存的数据同步动作以避免出错……不过,下一代处理器将完全避免这些弊病。
首先,两个独立的处理核心之间会建立一条高速通讯通道,这样两个核心中的任务可以随时进行交换,使得两者的状态始终相同——空闲的时候两者都空闲、工作的时候两者都工作,而且两者的工作量也不会有着太大的差异。





其次,下一代处理器将会实现二级缓存共享设计。即使在电池管理模式下,一个核心被暂时关闭,另一个处于激活状态的处理核心也能调用全部的缓存,避免出现性能过渡下降的情况。此外,下一代处理器架构的二级缓存将采用Pentium M的低功耗缓存技术,即在一段时间内,只有一个小单元处于激活状态,其余暂时不使用的缓存单元则处于关闭状态。这样一来,不管处理器的缓存容量有多大,它们的能源消耗始终维持在一个相当低的水平。
在缓存功耗方面,Intel下一代处理器将使用休眠晶体管来解决功耗问题。休眠晶体管技术与Dothan处理器所使用的“智能型线路”技术有着相似之处:两者都应用了让处理器中的“功耗大户”——缓存晶体管在空闲时切断其电源的方式来达到降低功耗的目的。Intel为缓存SRAM部分引入休眠晶体管来控制其功耗,当SRAM的某些区域处于空闲状态时,休眠晶体管会自动切断该部分的电流供应线路;当处理器需要调用该区域SRAM的时候,休眠晶体管又会自动打开通往该区域的电路,从而使整个缓存的功耗大大降低。在整个过程中,休眠晶体管充当了一个智能“开关”,它可以很好地判断哪些区域的供电线路可以被切断而哪些不能、已经被切断电流的区域哪些需要供电而哪些不需要。由于现有的处理器都具有较大的缓存单元,相信处理器内部加入休眠晶体管可以大大降低产品的功耗。
总体来看,Merom/Conroe/Woodcrest都将采用65nm制造工艺,其中在前端总线方面,Merom为667MHz 、Conroe为1066MHz,而Woodcrest为1333MHz;二级缓存容量方面,Merom将拥有4MB的容量、Conroe则将针对不同需求提供2MB和4MB两种选择,而应用于服务器市场的Woodcrest的缓存容量将会更大;在功耗方面,Merom有望达到最低5W的水平、Conroe最低能达到65W,就是使用在服务器上的Woodcrest最低功耗也能达到80W,对比现有的处理器来说,新一代处理器功耗下降幅度非常明显。