从4004到Athlon64(四)

硬件档案

PentiumⅢ VS Athlon

1999年初,英特尔发布了新一代处理器:采用Katmai核心的PentiumⅢ。PentiumⅢ采用0.25微米制造工艺,依旧采用Slot1接口,拥有32KB L1 Cache和512KB半速L2 Cache,外频为100MHz,新增了SSE(Streaming SIMD Extensions)指令集,增加了70条指令,同时为配合SSE指令集,增加了8个新的128位单精度寄存器(4×32位),能同时处理4个单精度浮点变量,可达到每秒20亿次浮点运算的速度。

51-p3.jpg

1999年8月17日,AMD推出了其K7处理器,并正式将它命名为Athlon,核心代号为Pluto。首批Athlon采用0.25微米的工艺制造,包含128KB的L1 Cache,512KB到2MB的L2 Cache(其速度为处理器主频的一半或2/5)。AMD为Athlon准备了全新的Slot A接口——一个和Slot 1非常类似的接口。Athlon处理器采用了Compaq(康柏)授权的Alpha EV6总线,前端总线频率可以达到CPU外频的两倍。此后不久,AMD又发布了采用0.18微米工艺制造、使用Orion核心(K75)的第二代Athlon。Athlon的发布给了Intel前所未有的冲击,无论是浮点性能还是整数性能,Athlon均大幅领先于Intel的PentiumⅢ。

51-k7.jpg

面对Athlon的冲击,加上Coppermine核心又连连跳票,英特尔不得不推出了133MHz外频的Katmai核心PentiumⅢ来抵挡。1999年10月,英特尔终于推出了Coppermine核心的PentiumⅢ,它采用0.18微米制造工艺,拥有100MHz和133MHz两种外频。L2 Cache被整合到了CPU内部,256KB全速Advanced Transfer Cache采用8路并联设计,再加上6路系统总线缓冲(Katmai只有4路),Coppermine核心的PentiumⅢ性能大幅提升,同时更低的电压和更小发热量使其超频性也非常突出。同时,Coppermine核心的PentiumⅢ逐渐转向Socket370接口,Slot1接口开始退出市场。

51-vp3-c.jpg

2000年3月,英特尔发布了代号为Coppermine128的新一代的Celeron 处理器——也就是我们常说的CeleronⅡ。新Celeron采用了Coppermine核心,具有32KB L1 Cache和128KB L2 Cache,支持SSE指令集,工作在66MHz或100MHz外频。

1GHz竞赛

随着双方的竞争愈演愈烈,一场主频大赛开始上演,双方争相发布更高主频的CPU,大家也开始关注一个问题:谁能首先推出1GHz的CPU。这个谜底在2000年3月6日揭晓,AMD发布了基于Slot A架构第三代Magnolia核心的Athlon 1GHz,外置512KB二级缓存(运行频率只有CPU主频的1/3,即333.3MHz)。很明显,AMD似乎还无法为其1GHz的处理器配备400MHz的二级缓存,为了占据先机只能牺牲一下性能了。两天后,3月8日,英特尔也发布了1GHz的PentiumⅢ。此后不久,英特尔又发布了PentiumⅢ 1.13GHz,试图成为市场上主频最高的产品,结果由于种种问题,PentiumⅢ 1.13GHz并不能稳定地工作在1.13GHz,最后不得不全部召回。

雷鸟与毒龙共舞

2000年6月,采用Thunderbird(雷鸟)核心的第四代Athlon处理器上市,采用0.18微米工艺制造,内置128KB的L1 Cache和256KB的全速L2 Cache。Thunderbird核心的Athlon处理器有Slot A和Socket A两种不同的接口,其中Slot A接口的主要面向OEM市场,零售市场上很少看到。同时AMD还对自己的产品进行了细分,推出面向低端市场的Duron,采用Spitfire核心,0.18微米铝工艺制造,内置全速的128KB L1 Cache和64KB全速L2 Cache,采用Socket A接口,工作在100MHz外频。Duron的上市给了CeleronⅡ极大的冲击,其性能更强,价格却更低。

51-thunderbird.jpg

Pentium4,一切为主频服务

面对Athlon的步步紧逼,2000年11月20日,英特尔正式发布了采用Willamette核心的Pentium 4处理器。该处理器采用了全新的NetBurst架构,流水线达到了20级之多,这使得Pentium 4可以轻松达到更高的主频。Pentium 4具有8KB L1 Data Cache,12KμOPs Trace Cache和256KB全速L2 Cache,采用0.18微米制造工艺,工作在100MHz外频,Quad Pumped总线技术的采用使前端总线频率为CPU外频的4倍,达到了400MHz。Pentium 4的算术逻辑单元(ALU)以核心的两倍速度运行,大幅提高了其整数运算能力,同时还增加了对SSE2指令集的支持,144条指令的加入进一步提升了其视频、语音、加密和图形图像处理性能。最初的Pentium 4处理器采用Socket423接口,此后又转向了Socket478接口。

51-p4.jpg

2001年底,Intel又推出了采用0.13微米的Northwood核心Pentium 4,具有512KB的L2 Cache,同时具有更低的电压和发热量。Northwood核心Pentium 4采用Socket478接口,外频自100MHz开始,以后又陆续推出133MHz、200MHz的版本。

姗姗来迟的王者

推出Pentium4的同时,英特尔将Coppermine核心PentiumⅢ的制造工艺改进到0.13微米,还推出了Tualatin核心的PentiumⅢ,采用0.13微米工艺制造,具有512KB L2 Cache,还采用了Quadword Wide(四倍缓存)数据总线。由于工艺的改进,Tualatin核心的PentiumⅢ电压更低,发热量也更小。其性能之强让所有人震惊,一举超越了Athlon,甚至低频的Pentium 4都不是它的对手。2002年初,英特尔又把Tualatin核心引入Celeron,这就是我们此后俗称的CeleronⅢ,除了L2 Cache减小为256KB外,别的都和Tualatin核心PentiumⅢ一样。

在责难中成长的Celeron4

2002年6月,英特尔又发布了Willamette核心的Celeron 4(英特尔从来都将它称之为Celeron,不存在一代、二代的划分,只是DIYer为了方便称呼,约定俗成地分为一代、二代、三代和四代),L2 Cache减少了一半,只有128KB,采用Socket478接口。可惜,Willamette核心的Celeron4性能低下、热量惊人。虽然其主频要远高于CeleronⅢ,但是在大多数项目的性能测试中却处于绝对的下风,只有在支持SSE2的项目中才可以勉强看到一点Celeron4的风采。2002年9月18日,在Willamette核心的Celeron 4仅仅发布了三个月后,英特尔又带来了L2 Cache仍然为128KB的Northwood核心的Celeron4。Northwood核心的Celeron4自2.0GHz起跳,Celeron4 2.0GHz在不加电压的情况下都可以轻松超到133MHz外频,主频达到2.66GHz,其良好的超频性征服了众多DIYer,同时发热量和性能较之于Willamette核心又有了相当大的改进,Celeron4开始逐渐为中低端用户所接受。

51-celeron 2.0.jpg

龙族,超频&改造

面对英特尔咄咄逼人的出击,2001年10月9日,AMD发布了采用了Palomino核心的第五代Athlon处理器——Athlon XP。Palomino核心相对于Thunderbird核心进行了优化,处理器功耗降低20%,发热量大大降低。同时新核心中集成了热敏二极管和温控电路,使处理器具备内核温度探测和过热保护功能,解决了被人们所诟病的易烧毁问题。同时,Palomino核心支持3DNow! Professional指令集,增加了对SSE指令集的支持。在发布Athlon XP的同时,AMD又发布了Morgan核心的新Duron,采用0.18微米制造工艺,同时增加了温控电路,增加了对3DNow! Professional指令集的支持,采用低电压设计,功耗较Spitfire降低了20%。

此后,AMD又推出了采用0.13微米制造工艺的Thoroughbred核心处理器。Thoroughbred核心和Palomino核心几乎完全一样,但是由于生产工艺的进步,Thoroughbred的发热量更小,超频性能也因此而更加出色,许多1700+/1800+都能不加电压超到2600+。

后来,Thoroughbred核心的改进版也悄然上市,为了便于区分,我们就把前者称为Thoroughbred-A,而把后者称为Thoroughbred-B。Thoroughbred-B较Thoroughbred-A核心多了一层铜互连层,核心面积由80mm2增大到了84mm2,频率极限也提高到了2.25GHz。

K8核心由于种种原因不断跳票,而800MHz前端总线Pentium 4又给AMD前所未有的压力,AMD重新翻出了曾经一度想搁置的512KB二级缓存方案——Barton核心应运而生。Barton核心在Thoroughbred核心的基础上增加了256KB L2 Cache,工作在166MHz外频。Barton主攻中高端,还需要一款产品镇守中低端,那就是Thorton核心。Thorton核心是Barton核心通过屏蔽一半L2 Cache得到的,这很快就被DIYer们发现了,并研究出修改金桥改造Thorton核心为Barton核心的方法。

K8,用64位打造新时代

2003年4月22日,AMD终于如期发布了K8核心处理器——面对企业级服务器市场的Opteron。采用0.13微米制造技术,集成128KB L1 Cache、1MB L2 Cache、双通道DDR内存控制器和Hyper Transport控制器。Opteron处理器采用Socket940接口,支持双通道内存架构,最多支持3条通往I/O的连接。

51-athlon64fx.jpg

2003年9月23日,在Computex大展上,多次跳票的Athlon64终于发布了。Athlon 64分为Athlon64和Athlon64 FX两种,都采用0.13微米工艺,支持64位运算,最大支持4GB内存,支持HyperTransport总线,集成内存控制器,其中Athlon64 FX支持双通道内存架构,采用Socket940接口,此后不久又转向Socket939接口;而Athlon64只支持单通道内存架构,采用Socket754接口(后期采用Socket939接口的Athlon64也支持双通道架构)。Athlon64 FX和Opteron一样,放弃了PR值标称频率,而是改用数字编号来区分频率。

2003年秋季,AMD又针对低端市场发布了Applebred核心的Duron,采用0.13微米生产工艺,核心电压降低到了1.5V,同时具有133MHz的外频,其性能提升不少。

Prescott“煎锅”

面对Athlon64的强有力冲击,2004年11月3日,英特尔发布Pentium 4 Extreme Edition,简称P4EE(又称P4XE),增加了2MB的L3 Cache。P4EE采用了Socket478接口,可以兼容于各种Socket478的主板。P4EE增加的2MB L3 Cache在一定程度上提高了其性能,但是带来的发热量和成本的成倍增长让这款产品更多只是作为一个高端形象产品存在。

51-vprescott.jpg

2004年2月2日,仍旧基于NetBurst架构的新一代Pentium 4核心——Prescott面世了。Prescott核心基于90纳米工艺,仍旧采用Socket478接口,具有16KB L1 Data Cache(一级数据缓存)、12KμOPs Trace Cache和1MB的L2 Cache。Prescott的流水线达到了31级,这使得其主频可以提升得更高,但是执行效率则进一步降低。此外,Prescott还改良了其分支预测的精度,采用了增强型超线程技术,增加了对SSE3指令集的支持。虽然Prescott核心采用了0.09微米工艺,发热量相应减少了许多,但是其功率还是非常惊人。尽管存在许多问题,但是Prescott仍将很快取代Northwood核心,成为英特尔高端的新王者,而在不久的将来,Prescott将全面转向Socket T接口,Socket478接口也将结束其历史使命。

2004年6月,英特尔又发布了对应于Prescott核心的Celeron D。具有256KB L2 Cache,工作在133MHz外频,其他的则与Prescott核心的Pentium4无异。由于L2 Cache和外频的提高,Celeron D一改Celeron系列给人们的孱弱印象,性能直逼AthlonXP,同时具有非常好的超频性能,不少都可以超频到3GHz甚至更高。

同样在6月,英特尔采用了全新的命名规则,将其桌面处理器分别命名为3XX(Celeron处理器)、5XX(Pentium 4处理器)和7XX(Pentium M处理器)。

闪龙,低端市场的明日之星

2004年7月28日,针对英特尔的低端产品线,AMD启动了一个全新的品牌——Sempron(闪龙)。作为Duron的继承人,Sempron横跨SocketA、Socket754以及Socket939接口,将具有多个核心。最先一批发布的Sempron基于SocketA和Socket754接口,其中SocketA接口的Sempron采用Thoroughbred-B核心,将外频提高到了166MHz,同时将PR值进一步标高。而基于Socket754接口的Sempron则采用Paris核心,只具有256KB的L2 Cache,同时不支持64位运算。虽然如此,其性能还是让人们眼睛一亮,不但胜过Celeron D和低频的Pentium 4,与同频的Athlon 64也相差不大,同时超频性能也不弱。