新丁报到(4):Intel Prescott处理器——是惊喜,还是失望

硬件周刊

  当我们还在盼望Socket 478 接口的Prescott(Tejas) Pentium 4处理器会给我们带来多少惊喜的时候,Intel就已经在准备LGA 775接口的Prescott Pentium 4发布工作了。近日国外一些IT硬件网站公布了LGA 775接口的Prescott 2.8GHz神秘处理器实物图,并且也进行了工程样品的测试,但从一些实际的报道来看,Intel LGA 775处理器并没有我们期待的那样好。所以,今天我们有必要来说说LGA 775处理器。

  Prescott当Tejas

  先前Intel公布的Prescott Tejas处理器,我们对它的了解也是很肤浅的,甚至对它的理解也是不正确的。比如传言说它内建双核心,导致其功耗可能达到150W等,不过国外某媒体在测试时关闭HT后,在Windows下只能识别出一个核心,并且官方也透露其功耗并没有超过100W(实际数据官方并未透露,值得怀疑)。其实Tejas 2.8GHz只是一个采用了0.09微米工艺、200MHz外频、主频2.8GHz的Prescott罢了。事实上Intel也曾透露Tejas最终会采用0.065微米工艺开始起步。近日,Intel公开亮相的Prescott LGA 775(图1)更让世人觉得它简直是Tejas的变身版本,但从规格来看,LGA 775 Prescott 2.8GHz依然只采用0.09微米制程而非0.065微米,前端总线和Northwood核心的P4C一样为800MHz,电压为1.35V,并拥有1MB L2 Cache,基本规格和以前Socket 478版本的Pentium 4大致相同,只是把封装由Socket 478的mPGA改为Socket T的LGA罢了。

  LGA可助Prescott提升主频

  在LGA封装下的CPU,其特点是没有了以往的针脚,只有一个个整齐排列的金属圆点(图2),因此CPU并不用利用针脚来接触CPU插槽,而是需要一个安装扣架固定,让CPU可以准确压在Socket卡槽的具有弹性的触点上。其原理就像BGA一样,只不过BGA是用焊锡焊接固定了,而LGA则是可以随意自由取下扣架而更换芯片(图3)。目前mPGA技术已经几乎发展到了物理极限,由于CPU针脚形式容易受到外界干扰,就如收音机的天线一样,而且针脚越长,其噪音也就越大。虽然可以尽量缩短长度来降低噪音,可是CPU的针脚太短的话,可能会出现CPU接触不良,即便可以解决接触问题,减少CPU针脚的长度也需要在Socket的制作上增加更多的成本。这种情况下只有LGA无针脚技术才是一劳永逸的最佳办法,即使是成本增加了,但却能完全解决干扰带来的噪音问题,消除了日后Intel在频率提升与改进上的一个最头痛的问题。

  L1与L2 Cache的改进

  其实Prescott在内核的Cache设计有一定的改进,L1 Date Cache数目由Northwood的8KB增至16KB,这样可以让L1 Cache的工作效率得以提升,而L1 Trace Cache则维持不变。由于目前的新版CPU-Z 1.20a测试软件并未能完全对Prescott进行有效识别,因此并不能测试出其管道数目是否有所增加?而L2 Cache方面,Prescott跟Northwood在设计上基本保持一致,只是Prescott把L2 Cache的大小由512KB提升至1MB罢了,当然还提供了高级能源管理,同时加入了13条新指令(图4)。

  14×倍频被锁定了

  在2004年2月中旬,Intel将会推出Pentium 4 3.4C GHz及Pentium 4 XE 3.4GHz,并且据外国某媒体测试发现,Prescott并不可以调节倍频,最大倍频只能是14×。在主板BIOS的CPU倍频设置中,其中Max与Min的数值显示为14灰色无法进行自定义调节(图5),在14×下就锁定了倍频实在让我们感到遗憾。另外,在实际测试工程样品时,还发现BIOS默认显示Prescott的电压为1.33V,和官方公布的标准有0.02V的偏差,但这不影响它正常工作,而且功耗的减小会降低一点点温度。而且,目前的BIOS版本还无法正常识别Prescott(图6)。此外,据业内人士了解,Intel可能不会推出2.8GHz等低速的LGA775版本Socket T处理器,因为它与目前的Northwood核心的Pentium 4的性能相比差别并不是太大,但成本却略有增加,因此LGA775推出时极有可能会由3.6GHz或3.8GHz起跳。

  Prescott不及Northwood

  如果要区分Prescott与Northwood之间的技术标准,可以说L1和L2 Cache的大小、SSE3的支持情况、Hyper-Threading技术的改进是最明显之处。最令人争议的是Prescott由以往的20层增至目前的32层Pipeline(流水线),Intel曾经说过Prescott处理器并非是一款具有革命性革新的产品,而只是现有产品的进一步演化,只能够算是一款后续型产品。Northwood核心的Pentium4处理器拥有20级流水线设计。为了保证处理器的执行效能,Intel增加了许多其他机制以减少因为流水线的增加而带来的效能损失,但Pentium4的平均执行效率仍然要低于只有10级流水线设计的Pentium3处理器。虽然先前曾经有相关报导指出Prescott有可能增加对64位指令的支持,不过我们目前至少可以确认在2月份所推出的Prescott处理器里面绝对是没有整合64位指令集的,因此对增加了12级流水线的Presscott处理来说,Intel就必须增加更多的机制来保证一定的执行效率,比如说增加寄存器,提高L1 Cache的搜索效率,增加分支预测的准确度等。但从Pentium4的经验来看,Prescott想要保证拥有和原有的Pentium4一样的执行效率恐怕还是十分困难的。

  依然是发热量问题

  我们知道,要提高处理器的频率,首先需要从两个方面入手:第一是制程上的改进;第二是技术上的改良。可目前在制程上可以改进的空间已经不大,就算要进一步改进制程,要面对的技术问题也很多,比如要解决处理器的巨大发热量的问题,执行效率的问题等。而Intel为了继续采用一贯的高频率方案来占领市场,这是不很明智的做法,为此Intel则考虑加大CPU的Pipeline Stage来达到提升频率的目的。因此,很多人认为在相同的频率下,由于Prescott的发热量大,会比Northwood的性能低。但是事实上却并非如此,因为据相关媒体在测试时发现,在正常工作状态下把CPU的散热风扇拿走,运行15分钟3Dmark后也没有出现CPU被烧毁,而且立刻重启电脑后在BIOS里发现CPU的温度也只有64℃(图7)。看来Prescott并没有传闻中所说那么高的发热量。由此看来,Prescott作为Northwood的下一代产物,技术问题解决后一定会比Northwood的性能要高。当然这里起决定性作用的应该是流水线增加。

  增加Pipeline Stage并非最佳方法

  从Intel增加CPU的Pipeline Stage的方法来达到提升频率的解决方案中,我们也许产生了质疑,为什么增加Pipeline Stage可以获得更高的频率呢?首先我们来看看Pipeline原理,Prescott有32Stage的Pipeline,则代表CPU可以把一个指令分成32份进行,而每一MHz可以运行两个Stage,因此32Stage就大概需要约16MHz,而CPU可以在同一时间处理十几个指令,但新的指令需要等待上一个指令的Stage完成后才能开始。所以,如果把Stage分得更细一点的话,即每个频率所承受的负担也就会减少,而能尽快完成某个指令继续开始下一个指令,这样就能轻易提升处理器的频率了。话虽如此,但这个理论是假设CPU的工作在永远不出错的情况才成成立,由于目前的CPU都是利用Branch Prediction(预支结果)来增加效率,但Branch Prediction是不可能保证100%不出错的。如果当32 Stage中有其中一个Stage出错的话,工作就需要重新进行,而其他需要得到这个工作结果的相关指令也可能需要重新进行(因为流水线的各个级是相互关联的),这样Stage的Branch Prediction出错数量越多所导致的延误就越大,最后使处理器的性能反而降低。

  因此,如果想通过增加Stage让频率和性能得以提升,关键在于Branch Prediction的准确度,就连CPU开发工程师都无法保证让Branch Prediction做到这一点,32条Pipeline能否增加性能就很难说了。能否排除因Branch Prediction错误延迟而带来的后果也是无法保证的。无论如何,可以肯定的是,据某业内人士从Intel的某个发布会中得到一个答案,在同一个频率下,某些程序在Northwood上运行会比Prescott更快,看来就是由于Pipeline数量设计不同而致。所以,我们更加肯定在同一频率下,起码目前1MB L2 Cache的Prescott在某些程序运行下的性能要比Northwood低,看来增加Pipeline数量并非最佳办法。

  CPU针脚从此不再断针

  在此之前,笔者从使用电脑至今,也有过很多次由于某些原因让CPU的罢工,也许你在猜测种种原因导致,超频超死了?不是;散热不良烧了?也不是。其实笔者非常喜欢玩CPU,经常把CPU拿下来在不同的主板上插来插去(特别是评测的测试品),这样导致了CPU的某个针脚因承受不了压力而断了。假如CPU没有针脚呢?是不是给我们带来了惊喜?Prescott这样的设计能否让未来不发生断针的事故?大家也不要高兴得过早,因为多了在Socket上的触点,这些触点柔软而富有弹性,也是很容易断的(如图8的就已经被弄断了),因此用户尽量不要用手去接触这些触点,否则就算不断也可能会造成短路或接触不良等故障,所以没有了针脚的Prescott也不能保证万无一失。

  后 记

  以上我们了解到了Intel下一代Socket架构CPU的大概特点,但从所说的来看,我们感到有点失望,笔者认为此次Intel的设计太过于保守,在架构上Prescott与Northwood相差不大,改进的地方并没有多少突出的特点,相对于K8与K7的64位突破、内置内存控制器及HyperTransport技术等,还显得有点粗糙。所以,Intel这样的做法,并不是完整意义上的新东西出炉。看了以上的陈述,你是惊喜还是失望?