细看迅驰4的急先锋
特别策划
尽管早在2006年7月27日,Intel就对外统一发布了新一代的代号为Conroe的台式机Core 2 Duo处理器和代号为Merom的笔记本移动Core 2 Duo处理器(以下简称Merom处理器)。但是Merom处理器犹如神龙见首不见尾,自从Intel的发布会后就再难见芳颜。
我们估计,由于Intel的Yonah处理器的性能已经能够满足目前人们对性能的需求,为了更多地占领市场和消化产品,Intel没有立即将Merom投放市场。这一犹豫为AMD创造了机会,AMD的Turion64 X2处理器开始进入笔记本市场,而且现在AMD更有了ATI的大力支持,在笔记本市场上有希望进一步成长。尽管和Yonah处理器比起来,Turion64 X2在性能上还有一点差距,但Yonah处理器始终有一个硬伤——那就是不支持64位运算。在支持64位运算的Windows Vista上市前夕,Intel决不会坐等Turion64 X2抢占市场,终于要拿出Merom处理器这件法宝了,于是8月底,采用Merom处理器的笔记本开始在市场上出现。
Merom的变化
和Yonah相比,支持64位运算的Merom处理器流水线增加到了14级,因此Merom可以更容易地提升频率。就目前的资料显示,Merom将会出现2.4GHz及以上频率的处理器,相比最高2.33GHz的Yonah,增加流水线的效果相当明显。不过流水线的增加也导致处理器执行效率会有一定程度的降低,为了同时提高执行效率,Intel在Merom中增加了1个数学逻辑运算单元(ALU:Arithmetical Logical Unit),让SSE指令能够在一个时钟脉冲内执行完,更采用了新的预取机制提高了二级缓存的效能。
Merom处理器分二级缓存为4MB的和二级缓存为2MB的两种,都是由双核心共享,和Yonah一样。不过二级缓存为2MB的Merom是8路联合而二级缓存为4MB的Merom为16路联合,保证了二级缓存的存取速度。Merom比Yonah增加一个Simple解码器,多出一个FSTORE和一个FLOAD,更增加了两个SSE单元,这样一来,Merom借助于3个强大的SSE处理单元在处理SSE多媒体指令时效率高得多。得益于全新的架构,Merom能够每个周期执行一次分支预测而不是每两个周期才执行一次分支预测。而且,Merom把Reorder缓冲从Yonah的80个提高到96个,使它可以一次执行96条指令。


Merom的技术特点
尽管采用的晶体管数量增加了近一倍,但得益于更先进的设计思路和技术,Merom处理器的功耗并没有增加,下面我们就来看看Merom究竟有哪些技术亮点。
Wide Dynamic Execution(宽位动态执行)
Merom拥有4个并行处理单元,在整个运算过程中能够保持4个执行宽度,这样一来Merom处理器可以同时处理获取、释放、执行和回复等4个指令。此外,Merom采用了Pentium M处理器用来减少微指令(micro-ops)总数所用的技术,将微指令分成处理器能够识别的x86指令,两个这种指令就可以变成另一个微指令,减少了处理的指令总数,能够节省运算时间与能源,通过这种微指令融合(Micro Ops Fusion)功能大概每十个指令可以省下来一个,被整合到下一个指令去。这个将微指令融合的创意也整合到指令的阶层,称为指令层平行化(instruction level parallelism),让两个独立指令,例如一个比较和一个跳跃指令,联合起来,并且一起译码一起执行,这个被称为微指令融合的功能甚至被带进所有的数学逻辑运算单元(ALU),也就是允许在整个单一指令执行时钟脉冲下,执行两个指令所组合的微指令,或是只执行普通的指令。
这些指令融合机制可以显著地帮助增加每一个核心的处理效率,因为融合起来的指令也是另一种型态的指令,或看成微指令阶层的融合。
Advanced Digital Media Boost(高级数字媒体增强)
数学逻辑运算单元(ALU)会将指令分成两个区块,产生两个微指令,因而也就需要两个执行时钟脉冲,而Merom的执行宽度增加到三个ALU,可以一次储存或导入128位的数据,允许八个单精度浮点或四个双精确度浮点区块的数据在一个执行时钟脉冲内执行,因为这个功能放进了SSE指令的执行,所以称之为高级数字媒体增强(Advanced Digital Media Boost)技术。Intel希望通过它来显著提高Merom的各种多媒体处理应用能力,例如编码、转码、压缩等等的处理。
Advanced Smart Cache(高级智能缓存)
高级智能高速缓存通过核心内部的Shared Bus Router将二级缓存(2MB或4MB)共享给两个处理器核心使用,同时加入L2 & DCU Data prefetchers及Deeper Write output缓冲,大幅增加Cache的命中率,缓存的效率可以大大提升,而不是像以前一样需要在两个不同的二级缓存中各复制一次。这个完整的二级缓存可以依每一个核心负载的需要做最大弹性使用,一个核心甚至可以使用所有的二级缓存,而且Merom提供给核心的带宽更大。这样一来,数据的共享也就变得更有效率,而不再需要借助前端总线的运作来存取数据进入缓存,当Merom要存取高速缓存的数据时,就不会有延迟。
与此同时,通过Shared Bus Router,在系统工作量不高或是处于闲置状态时,Merom可以把其中一颗核心关掉,以减少处理器的功耗,不过却可以让所有的二级缓存保持在工作状态,而且Shared Bus Router也可根据二级缓存的需求量改变使用的二级缓存的大小,在不必要时关掉部分二级缓存以降低功耗。
Smart Memory Access(智能内存访问)
Merom处理器配备总数为8个的prefetcher(预取)单元,其中每个核心都安排有两个数据和一个指令prefetcher,其余的两个并入共享的二级缓存中。prefetcher采用一个非常随机性的算法将核心需要的数据提前放进一级缓存中,而二级缓存中的prefetcher靠着内存存取模式的信息,去预测哪些数据会被移入二级缓存中,对内存读取顺序做出分析,智能、预测性地装载下一条指令所需要的数据以降低内存延迟,增加效率。
同时,Merom还采用了Memory Disambiguation(内存消歧)技术,通过智能的分析机制,预知并让一些独立的数据提早执行,减少处理器的等候时间,同时降低内存读取的延迟值。
Intelligent Power Capability(智能功率性能)
Merom采用了先进的65nm Strained Silicon技术、加入Low-K Dielectric物质及增加金属层,漏电减小为90nm制程时的1/1000。而且可以通过先进的功率门控技术,来充分利用该微架构的超精细逻辑控制,降低处理器的功耗及发热。
它还采用了Clock gating(频率门)和sleep transistors(休眠晶体管)设计,通过细微的逻辑控制机能独立开关各运算单元,只有需要时才会被开启,可避免闲置时出现的不必要的电能浪费。而Enhanced SpeedStep在系统处于静止或低负载时,仍会采取降低频率的措施,而且各自核心分别管理,核心各个Buses及Array能够独立控制其VCC电压,当这些部分被闲置时会被运行于低功耗模式下。
Dynamic Power Coordination(动态功率调节)
通过动态功率调节,Merom可以“按需”提供经过协调的双核性能。除支持双核平台更深度和增强型更深度睡眠转换外,动态功率调节还支持单个内核动态转换至间歇、时钟停止和深度睡眠电源管理状态。还能单独协调每个内核增强型SpeedStep 动态节能技术和空闲电源管理状态转换,从而更加高效地管理电压和频率。Merom也同样支持动态总线暂停(Dynamic Bus Parking)和Enhanced Deeper Sleep with Dynamic Cache Sizing(支持动态缓存调整的增强型更深度睡眠),支持芯片组在处理器处于低频状态时断电并动态调整缓存,降低CPU电压,延长电池的使用时间,从而降低平台能耗,还可以对CPU的双核心进行独立的状态控制,从而降低平台的整体能耗。
选择Merom的理由
尽管Merom处理器是属于下一代移动平台Santa Rosa的,但为了抢占64位移动运算市场,Intel做了一些妥协,使Merom处理器向下兼容。比如Merom同样采用Socket 479M接口而不是Santa Rosa平台采用的Socket-P接口,为了适应i945系列芯片组最高667MHz的FSB,将原本设计在Santa Rosa平台的Merom的FSB由800MHz降为667MHz,这样我们仅仅需要刷新BIOS就能够让i945GM/PM支持Merom处理器,升级的成本大大降低。
同时,采用全新设计的Merom处理器拥有更多的技术亮点,它是Intel第一款支持64位运算的移动处理器,在Yonah的基础上,Merom支持Wide Dynamic Execution(宽位动态执行)、Advanced Digital Media Boost(高级数字媒体增强)、Advanced Smart Cache(高级智能缓存)、Smart Memory Access(智能内存访问)和Intelligent Power Capability(智能功率性能)等新技术。Intel宣称Merom在提升了20%以上的性能的基础上,还有效降低了处理器功耗,延长了电池使用时间。这样一来不仅采用Merom处理器的笔记本性能更强,支持64位运算,而且拥有更长的电池使用时间。
如果上面这些优点都还不能说服你选择Merom,那么从定价来看,你也一样应该选择Merom。为了抢占市场份额,Intel将同频的Core Duo处理器(Yonah)和Core 2 Duo处理器(Merom)的价格定得一样,这样一来我们就没有了不选择Merom的理由。

和Yonah相比,Merom处理有相当大的变化,而这些变化最终都会体现在性能和功耗上。下面,我们再一起来看看采用Merom处理器的笔记本的测试情况。
Intel Merom系列评测之一:“相煎何急”Merom VS Yonah
2006年8月28日,在Intel发布Merom处理器整整一个月后,多家笔记本厂商几乎是在同一时间推出了采用Merom核心Core 2 Duo处理器(以下简称Merom处理器)的笔记本,将原本已经快要进行到尾声的暑促一下推向了高潮。在这一个月间犹抱琵琶半遮面的Merom处理器性能究竟如何,和Yonah相比,Merom有多大的优势,让我们用对比测试来告诉大家。
测试平台及方案
我们收到的这款采用Merom处理器的笔记本是神舟的承运L560T,它采用i945PM芯片组搭配Core 2 Duo T5600处理器(1.83GHz),并配备2×512MB DDR2 533内存、Mobility Radeon X1600(256MB)显卡、120GB硬盘、Intel Pro/Wireless 3945ABG无线网卡和DVD-RW刻录机,配合15.4英寸高亮宽屏,配置相当出色。

由于Core 2 Duo T5600是一款低端的Merom处理器,二级缓存只有2MB,为了让大家对Merom处理器的全貌有个清晰的了解,我们同时使用了二级缓存为4MB的Core 2 Duo T7400处理器(2.16GHz),利用同一平台,做了同样的测试,在测试结果表后,我们会具体分析。

由于我们目前没有采用Core Duo T2600(2.16GHz)处理器的Napa笔记本,为了尽可能地真实表现Core Duo和Core 2 Duo的性能差距,我们选择了与L560T同系列的采用Core Duo T2400(1.83GHz)的神舟承运L240R(Core Duo T2400 1.83GHz、2×512MB DDR2 533内存、Mobility Radeon X1600显卡、DVD-RW)笔记本进行了对比测试。两台笔记本均安装英文Windows XP专业版,并安装SP2补丁和DirectX 9.0c。所有测试均采用“便携/袖珍式”电源方案,仅在测试电池使用时间时采用了电池供电模式,其他测试均由适配器供电。
神舟承运L560T采用了和承运L240R相同的模具,主流的接口全部都有,分布也基本合理,银灰色的外壳非常大气,15英寸的宽屏给人稳重的感觉,做工还算不错。
在应用及综合测试中,我们测试了PCMark 04/05、SiSoftware Sandra Engineer 2007 SP1、ScienceMark和Superπ102万位/419万位的成绩,用Lame MP3把50分34秒的WAV文件(510MB)转成最高音质动态码率的MP3文件(最高320kbps、80.5MB),对音频编码性能进行了测试,用DivX编码器将一段26分45秒的DVD视频片段(0.99GB)转换成2400Kbps高画质的AVI视频文件(486MB),对视频编码性能也进行了测试,同时,我们还在3DMark 2001SE中采用D3D Software T&L模式对CPU性能进行了测试,并采用MobileMark2005进行了应用性能和电池使用时间测试。在3D性能测试中,我们在32bit色下,以1024×768分辨率对3DMark 03 Build 340和3DMark 05进行了测试。
整体性能,Merom全面领先

Superπ 102万位及419万位测试,Merom领先
尽管Superπ对CPU频率和系统内存性能比较敏感,但Core Duo T2400配备的也是DDR2 533内存,不过其架构决定了它的性能稍低,借助更先进的架构和高级智能缓存技术,频率和缓存都相同的Core 2 Duo T5600的性能有约4%的优势。而拥有更高频率和更大二级缓存的Core 2 Duo T7400即便是和Core 2 Duo T5600相比也拥有20%左右的性能优势,和Core Duo T2400比起来优势就更大了。
音视频编码压缩测试,Merom大幅领先
虽然多媒体编码压缩是Intel处理器的强项,不过Intel的处理器也是借助了SSE2及SSE3指令集才能够有更好的表现,由于Merom处理器拥有3个SSE处理单元,而且更支持SSE4指令集,因此音视频编码性能非常突出,即便是Core 2 Duo T5600和Core Duo T2400的频率和缓存都相同,Core 2 Duo T5600也在音频编码上拥有7.4%的优势,在视频编码方面拥有8.6%的性能优势。而相对于Core Duo T2400,Core 2 Duo T7400频率更高,二级缓存更大,因此在音频编码方面领先21.6%,视频编码能力更是领先了25.3%。
ScienceMark 2.0 Primordia,Merom领先
在ScienceMark 2.0 Primordia的测试中,解码器的个数对性能的影响较大,尤其是complex 解码器对性能影响巨大,这也是K8架构的移动处理器(Turion64/Mobile Athlon64)的性能比Yonah更强的原因。不过Merom不仅架构更优,更比Yonah多了1个simple解码器,因而性能也就有了一定提升。频率和缓存都相同的Core 2 Duo T5600和Core Duo T2400相比,Core 2 Duo T5600也有4.8%的性能优势,频率更高二级缓存更大的Core 2 Duo T7400更拥有19.2%的性能优势。
3DMark 2001SE D3D Software T&L,Merom遥遥领先
在D3D Software T&L模式中,所有的光照和几何转换都交由CPU运算,以考查CPU的浮点运算能力以及内存系统的数据传输能力。此项测试,架构更优的Merom平台优势尽显。频率和缓存都相同的Core 2 Duo T5600和Core Duo T2400相比,Core 2 Duo T5600拥有17.2%的性能优势,频率更高二级缓存更大的Core 2 Duo T7400的性能优势甚至接近了50%,达到了43%。
MobileMark2005测试,Merom占优
测试之前我们估计由于芯片组相同,内存频率也相同,尽管Intel宣称能够提高20%左右的处理器性能并降低功耗,但对MobileMark2005测试来说,频率和缓存容量相同的Yonah和Merom得分应该差别不大。事实也证明了,同频率同缓存的Core Duo T2400和Core 2 Duo T5600性能差距非常小,仅2.6%,Core 2 Duo T7400相比Core Duo T2400也只有8.4%的性能优势。尽管Intel宣称Merom的功耗将有一定的下降,但是通过对电池续航时间的测试,我们可以看到,Merom和Yonah的功耗处于同一水平,当然考虑到Merom多了1.4亿个晶体管,而功耗竟能和Yonah相当,你就不得不佩服Intel在功耗控制上下的苦功了。
PCMark 04/05测试,Merom领先
由于Merom处理器的CPU性能更强,更拥有智能内存访问技术,因此在PCMark 04/05测试中,Merom处理器是占据相当优势的。不过由于我们测试的这两块Merom处理器都是工程样品,在PCMark04中,Core 2 Duo T7400无法完成CPU测试,而在PCMark05中,Core 2 Duo T5600平台的磁盘性能稍稍低于Core Duo T2400平台。
SiSoftware Sandra Engineer 2007 SP1测试,Merom优势明显
借助优秀的架构和全新的SSE4指令集,Merom在各项性能方面均以明显的优势领先,尤其是在多媒体性能表现上,即便是频率和缓存都相同的Core 2 Duo T5600和Core Duo T2400相比,Core 2 Duo T5600的Multi-Media Int性能也领先了252%,Core 2 Duo T7400更领先了318%。
CineBench 9.5测试,Merom优势明显
CineBench 9.5是使用CINEMA 4D针对CPU和视频进行测试的软件,它支持多处理器和超线程的测试,记录处理器处理同一张图片的时间和测试成绩。我们通过单CPU和多CPU的测试来检测CPU的性能,从处理时间和CPU的得分来看,Merom的优势是比较明显的。
3D性能,Merom平台稍胜一筹

由于Merom平台和Yonah平台采用的芯片组、显卡完全相同,连模具都是一样的,理论上讲这三个平台的3D性能应该大致相同,Core 2 Duo T7400平台和Core Duo T2400平台的性能对比也说明了我们的估计是正确的,两者之间的差距只有4.6%,连5%都不到,考虑到Core 2 Duo T7400的性能要强得多,这个成绩是完全正常的。不过Core 2 Duo T5600平台的测试结果就低得让我们非常意外了,因为Core 2 Duo T5600平台和Core 2 Duo T7400平台除了CPU之外是完全相同的,我们更换CPU反复做了测试,结果始终是这样。我们监视Core 2 Duo T5600的频率时发现它的频率非常不稳定,因为是工程版处理器,我们认为正是参与测试的这一款Core 2 Duo T5600存在问题,才导致3D性能出现异常。
不过,总的来说,Merom平台配合Mobility Radeon X1600的3D性能也是相当出色的,我们认为它完全能够流畅地运行目前所有主流的3D游戏。
值得期待的Santa Rosa
从Socket 479M接口的Merom身上我们已经能够感受到Merom处理器的强大性能,那么,作为Santa Rosa的组件之一的FSB为800MHz的Merom处理器性能表现就非常值得期待了。
在下一代移动平台Santa Rosa中,Merom将会搭配全新的支持800MHz FSB的Crestline芯片组,集成芯片组整合的图形芯片将支持DirectX 10及OpenGL 2.0,据传整合图形芯片的频率为400MHz,电压在1.05V以下,其最高功耗也只有13.8W,而性能将为GMA950的1.5倍,规格是相当高的。我们可以认为Santa Rosa中整合的将是性能最强的集成显卡,通过它,我们已经可以完成相当多的3D应用,对于非游戏发烧友来说,完全够用了。
同时,Santa Rosa的南桥将会采用ICH8-M家族,其规格和桌面版本ICH8略有不同,支持10个USB 2.0接口,而且其USB设计采用两个独立的EHCU控制器,当两个USB元件同时使用时并不需要分享USB带宽,并能提供5独个立USB供电模组,让高功耗的USB设备也能稳定地运行。更令人高兴的是ICH8-M内建Gigabit Ethernet MAC,只需要外接PHY就能提供10/100/1000Mbps网络接入能力,其加强版本甚至支持Intel Active Management Technology 2.5及RAID 0、1。
从Merom处理器的进步和Intel的宣传来判断Santa Rosa的整体性能,我们认为Santa Rosa平台将是相当值得期待的。
工程师点评:Yonah掘墓人
Socket 479M接口的Merom和同频的Yonah售价相同,既然并不需要增加成本,电池续航时间也没有缩短,消费者肯定会更愿意购买采用Merom处理器的笔记本,未来Yonah的日子也不会太好过。尽管笔记本厂商可以通过人为的价格控制来区分采用Yonah和Merom处理器的笔记本,但人们的购买心理决定了如果不继续降价,Yonah也只有死路一条。这也是采用Yonah处理器的笔记本近期频繁降价的根本原因——给采用Merom处理器的笔记本让路。在采用Merom处理器的笔记本上市之后,Yonah平台只剩降价一条路了,Yonah成了Intel最短命的迅驰平台处理器,毫无疑问Merom充当了Yonah的掘墓人。
不过,明年1季度即将上市的Santa Rosa平台将采用不同的接口,以保证能够支持FSB为800MHz的Merom处理器,也就是说现在的Merom也只是一个过渡产品。显然FSB为800MHz的Merom处理器性能更强,Santa Rosa平台也是一个强劲的平台,那么,Socket 479M接口的Merom也是一颗短命的CPU,Santa Rosa平台才更值得期待。
当然,应用才是决定需求的根本,由应用决定了需要购买笔记本的用户不可能等到明年Santa Rosa平台发布。我们知道,Merom处理器在执行一般应用时和Yonah处理器的差距并不大,只是在多媒体编码等应用中拥有较大优势,因此如果你并不看重64位运算能力,也没有什么多媒体编码处理工作,那么就完全可以选择价格更便宜的采用Yonah处理器的笔记本,而需要经常进行多媒体编码工作的用户,或者对处理器是否支持64位运算非常在乎的用户则可以选择采用Merom处理器的笔记本。而如果你只是准备在半年甚至一年内购买笔记本,那么我们的建议是最好等待Santa Rosa平台的产品发布,因为目前采用Merom处理器的笔记本毕竟不是Santa Rosa平台的产品,只是Napa Refresh。
在8月底,各大厂商都发布了很多采用Socket 479M接口Merom处理器的笔记本,部分品牌的产品已经能够在市场上买到,预计两周内全国都能买到采用Merom处理器的笔记本了,不过市场上的产品显然将以采用Core 2 Duo T5500/5600处理器的为主,只有少数采用Core 2 Duo T7200处理器的产品,毕竟采用Core 2 Duo T5500/5600处理器的笔记本才是市场的主流。