MPU竞争又一轮
1993年英特尔推出Pentium(奔腾),IBM、摩托摩拉、苹果等三家推出Power PC,曾使MPU的竞争出现一个新高潮。1994年在MPU领域是相对平静的一年,各厂家都在厉兵秣马,预示着1995年又将是出现新一轮竞争高潮的一年。
这新一轮的竞争,早在1994年10月在美国旧金山举行的“MPU论坛”会上,便拉开了帷幕。这一论坛是各厂家发表最新成果的场所,各厂家在会上剑拔弩张的姿态,意味着新的厮杀即将开始。
会上,英特尔的兼容厂家MDA、Cyrix的举动令人瞩目。特别是AMD,这几年来通过制造同英特尔兼容的芯片,取得重大成绩,已经占领了486市场的很大一部分,使英特尔叫苦不迭。但也因此同英特尔没完没了地打了多年官司,花费了巨大钱财和精力,尽管没有败诉,但也搞得精疲力竭。
现在AMD羽翼已丰,完全掌握了设计MPU的技术,所以将走自己的路子来同英特尔芯片兼容。它宣布将在1995年推出同Pentium兼容的芯片K5。K5在微结构上完全不同于Pentium或486,它用不同于Pentium或486的方法来执行x86的指令。这使得它同英特尔再也不会发生知识产权纠纷。同时意味着兼容厂家走入一个新的时代。
Cyrix和AMD一样,也将通过同Pentium兼容的芯片MI,走自己的道路,这一芯片也将于1995年推出。
使人刮目相看的是1994年刚冒出来的NexGen,它一亮相便拿出同Pentium兼容的Nx586,不仅比老牌兼容厂家AMD、Cyrix早一年,而且性能价格比还略优于Pentium,大有不鸣则已、一鸣惊人之势。
Pentium的本主英特尔看到X86的潜力快要挖尽,已经把它视为“鸡肋”,在这一论坛上没有发表什么新东西。据说它正忙于同HP(惠普)合作,开发“后RISC”结构,这是一种采用长指令字技术的芯片,将可以运行现在HP的PA-RISC芯片和英特尔x86芯片的指令。不过这一新芯片(代号为P7)要到1997-1998年才能够发表。
但是在今年2月于旧金山举行的ISSCC95(1995 IEEE国际固态电路会议)上,英特尔发表了新一代微处理器P6(现已正式上市,命名为Pentium Pro,相当于686),和Pentium的后继产品P55(开发代号名)。
在RISC领域六年来一直连续占领市场首位的Sun微系统,发表了新一代的64位RISC芯片UltraSPARC,由于它具有极好的图像处理功能,非常适合于多媒体用途。它的这一特点在RISC领域尚属首创,预计这一产品的出现,将带动RISC芯片进入新一轮的竞争。
另一个主要的RISC厂家MIPS,已经花了许多时间和精力开发诸如超低功率芯片R4200、加强浮点运算能力的芯片R8000/8010,以及低价格的芯片R4600 Orion等。然而它的主要产品系列仍然是R4000和R4400处理器。在这次论坛会上,MIPS发表了它的新一代产品T5,它将使MIPS产品性能,有重大的提高。
IBM、摩托罗拉、苹果也不后人。它们于1993年9月推出Power PC系列第一个产品Power PC 601,给Pentium以巨大威胁后,又再接再厉于1994年推出Power PC 603、604。在这次论坛会上,它又发表了Power PC系列中性能最高的,也是最后的一个产品Power PC 620。
不过,在ISSCC 95上,IBM又发表了原先没有列入Power PC产品计划中的Power PC 602,这是一种面向交互式电视用户一侧使用的机顶盒(用以指定所要的节目用的装置)和游戏机等用的芯片。其特点是既强化了图像功能和声音识别功能,又使耗电极少。在3.3伏电源电压和66兆赫时钟频率下,耗电不过1.2瓦。
另一家主要的RISC厂家DEC,在这次论坛会上并没有发表产品。然而,在这次论坛会之后不久,它便发表了当今世界上最快的MPU-21164。使它一下子又置身于令人瞩目的位置。
二、Ultra SPARC一马当先
自从美国提出要建设信息高速公路以后,多媒体应用如雨后春笋蓬勃发展。今后的计算机将和电视、电话等结下不解之缘。因此对图像处理功能、声音识别等提出越来越高的要求。
早先开发的RISC芯片对这一点估计不足,只着眼如何提高运算速度,因此在遇到图像处理方面计算量大的情况时,往往还要专门的用以处理图像的芯片配合工作。这不仅会影响处理速度,而且还会增加成本。
Sun微系统公司看到了这一问题,在它下一代RISC MPU即Ultra SPARC中将实现两个目标。一是使它比以往的型号都要快,另一是使这一MPU能在视像世界里起各种各样的作用。
Ultra SPARC(超级SPARC)使SPARC微处理器发生了重大变化。最重要的一点便是在一个芯片内集成图像处理的各种功能,它一次能够操作多达8个的像素。另外一些改变是修改了码段承接的切换结构,使得能够更好地运行多线程操作系统(通过分时运行多个线程,计算机便可同时执行多个任务),使编译程序能进行更好的优化。
Ultra SPARC将在1995年第一季度生产出样品,并将于1995年底投入大量生产。它将在时钟频率为200兆赫下,获得250-300 SPEint92的运算性能(SPEint92是用以表示整型数运算性能的单位,是按标准的测试方法来测定它的数值)。并有可能使运算性能随所用的时钟频率成正比地提高。
Ultra SPARC是第一个把各种图像处理功能都集成在一起的通用处理器。它的图像处理是FPU(浮点运算单元)中完成的。各种像素操作可以进行分解,以便增加操作的并行性。能够同时并行地完成多达8个的操作能力,对于视像图像信号的压缩和去压缩(复原)是非常有用的。在处理像素操作时,它使用专门指令,这使它能比其他RISC处理器快80倍。
任何一个现代处理器设计者最头痛的事,莫过于如何使数据放入或取出于芯片。Ultra SPARC在存储功能上作了重大改进,既加强了多媒体性能,又使系统的负载均衡化。
它的预取指机构可动态地预测分支,在SPECint92测试状态下,预测分支的正确率达88%;而在SPECfp92的测试状态下,预测正确率可达94%。
执行用的流水线是现代芯片的骨干部分,它的结构决定了所能达到的性能极限。Ultra SPARC有能力强大的流水线,每一时钟周期可以流过四条指令。它采取的指令按顺序流入,但不一定按顺序执行的方式,可明显提高流水线吞吐量。
不同码段组块之间的快速切换(码段承接切换)方面的能力正变得比以往任何时候都更加重要。因为现代的多线程操作系统和OOP(面向对象程序设计)二者都在把程序分割成更小的一块块,或者说连贯性更小。Ultra SPARC在这个方面作了改进,使码段承接切换能力有明显的提高。
现在桌上型机用户对图像和视像处理,越来越迫切需要。Ultra SPARC满足了这一要求。它的图像指令和快速成组数据传输,使得能够制成具有卓越超群视像处理能力的低价格桌上型机。这些图像处理指令将能加快视像处理速度和产生图像的速度。这些都将使桌上型机变得非常有魅力。而且Ultra SPARC还可以使Sun打入交互式电视时用户一侧使用的转换盒这一潜力极大的市场。
Ultra SPARC对Sun今后的发展,具有极为重要的战略意义。因为它是当前唯一的把图像处理能力集成在一起的RISC处理器,在计算机日益同视像结合起来的多媒体时代,它使Sun再一次能够用性能价格比好这一武器开拓更大广泛的厂家。而且64位Ultra SPARC的出现,使Sun的微处理器性能一下子提高了好几倍,使它不跃居于RISC处理器领域中的领先地位。这为Sun的今后更大发展,提供了坚实的基础。
? 三、Power PC620元帅升帐
Power PC是IBM、Apple、Motorola赖以同Intel对抗以重振雄风的产品。这一系列原包括4种产品,即适用低价格机的601、适用于便携式机低能耗的603、适用于高档桌上型机的604,另外便是面向工作站和高速服务器的620。今年又补充了面向家用机顶盒和游戏机的超低能耗的602。
在上述产品中除620外,都是32位的MPU,而620是这一系列中唯一的64位结构的MPU。620代表Power PC的最高水平,所以一发表后便受到人们的广泛注意。模拟的结果说明,在133MHz下,使用容量为4MB时钟频率为66.5MHz的二次高速缓存时,Power PC 620的性能将达到225 SPEC int 92和300 SEPC ft92。它的主要设计特点,如64位内部数据通路。64KB芯片上的高速缓存、6个独立的执行单元、高速的总线接口等,满足了为达到高性能所提出的要求。620的码段同先前的各种Power PC处理器兼容,它既可执行已有的32位Power PC的程序;又可执行专门为它而写的64位程序,以充分挖掘620的功能潜力。
620采用0.5umCMOS、四金属层的生产技术和604所用的一样。但是Power PC 620改进了晶体管的设计,使其能更快进行状态转换,因而提高了所有性能。620使用的工作电压和603、604一样,均为3.3伏。
与603、604一样,620也有芯片上的PLL(锁相环)电路,以获得处理器的时钟。而且处理器的接口可以在1/2、1/3和1/4的处理器时钟速度下工作,以支持较慢的存储器和各种装置。在133MHz的工作频率下,即便在最坏的情况下Power PC的耗电也不过30瓦。620还和603、604一样,有电源管理功能,这有助于实现节能使计算机能源的利用效率更高。
Power PC 620是Power PC系列中最后一种型号,它使用了700万个晶体管,几乎是604的两倍。然而这么多的晶体管才放在只有311平方毫米大小的芯片上。
由于有如此大量的晶体管,所以620能实现如下的一些新功能。第一,由于是64位处理器,故需要另外的硬件以支持64位数据类型和64位编址,从而使处理器许多内部数据总线和缓冲器,以及GPR(能用寄存器)和FPR(浮点寄存器),都拥有64位宽度。第二,有两个32KB的高速缓存。一个高速缓存用以处理码段通路,另一个用以处理数据通路。每一高速缓存都有自己的MMU(存储器管理单元),而且彼此可独立工作。第三,晶体管多,使620能够采用主动的分支预测机构,因为这时需要预测逻辑电路、64位重新命名缓冲器,以及一些用以存放所推测分支结果的保存位置。第四,处理器的总线接口也得到了加强。数据总线为128位宽,可直接支持二次高速缓存。
所有以上新功能,都是为了提高620的性能。
Power PC 620使用Power PC系列能够提供工作站级的吞吐量,而且在浮点性能上特别突出。它的速度和节能性能都足以与其他RISC处理器相较量。
虽然620是Power PC系列中最后一个处理器,但Power PC联盟仍在为强化已有的产品而忙碌。尽管对有关未来处理的消息讳莫如深,但通过开发601+便可一窥其端倪。
601+同601相比,工作电压从3.6伏降到2.5伏,在100MHz下工作时功耗只有4瓦,只有原先在66MHz下工作的601的一半。可以期待Power PC 603、604、620,今后也会有类似这样大的改进。
决定Power PC今后命运的关键,是用户是否认可。最早推出的使用Power PC的个人机,是苹果公司的Power Mac系列,不到一年便销出100万台。但由于Power PC专用的操作系统“OS/2 for Power PC”未能及时推出,使Power PC未能充分发挥其性能,因而没有达到所预期的轰动效果。Power PC今后成败的关键在于是否有配套软件。Power PC联盟希望通过PReP(Power PC参考平台)来做到这一点。
? 四、NexGen昙花一现
在近一年MPU竞争中,原先名不见经传的风险公司NexGen由于拿出不低于Pentium的第五代x86处理器,并声称将于1995年拿出第六代x86处理器而一举成名。堪称不鸣则已、一鸣惊人。
Intel早已垄断了个人机MPU市场,它的兼容厂家AMD、Cyrix也拥有雄厚实力。1986年刚成立的NexGen公司,要想后来居上,非下苦功搞出一些特点不可。因此NexGen成立后埋头开发,到1994年连续8年没有出售过一个芯片。 这种十年磨一剑的精神果然没有白费。1994年它终于拿出8年奋战的成果Nx586。这一芯片足以同Intel的Pentium相较量。而AMD、Cyrix要到今年才能拿出类似的芯片。所以NexGen已实现了后来居上的目标。
由于Nx586比较便宜,所以Alaris公司于1994年9月发表的采用Nx586的第一种PC,其零售价格也比类似的Pentium系统便宜10%。
NexGen取得成功的战略在于:以较低的价格提供几乎和Pentium性能一样的处理器,使自己在x86巨大的市场上能占有一席之地。NexGen所采用的技术最令人感兴趣的是,它的芯片是在不常见的时钟频率下运行,而这些并未被宣扬过。
和传统的看法不一样,NexGen认为时钟频率是可比性能中不大顶用的度量标准。当x86芯片的微结构继续发展下去时,它将变得更加不顶用。这已经在基准测试和模拟中得到证实。因为AMD、Cyrix、Intel、NexGen的586级处理器,在同样时钟频率下并未得到同样的性能。今后芯片设计将沿着不同道路发展,这种差异将会进一步拉大。
尽管目前已很难用时钟频率来比较不同MPU,如同是33MHz,486的便超过386的性能。但在同一代x86内部,时钟频率仍与其性能密切相关。如50MHz的486便表示其运算速度大约是25MHz486的两倍。但是由于不同的第五代x86的微结构有重大差别,因此这样的简单关系已不大适用。NexGen、AMD、Cyrix都声称,在同样的时钟频率下,它们的586级芯片将超过Pentium。
因此NexGen不强调其产品的时钟频率。它将Ne586系列四种产品分别叫做Nx586-P100、Nx586-P90、Nx586-P80和Nx586-P75。它们分别在93MHz、84MHz、75MHz和70MHz下工作。NexGen已经成功地运用这些古怪的时钟频率进行许多应用层次的基准测试,并获得足以同Pentium相较量的结果。NexGen声称,P100的性能相当于100MHz的Pentium,而P90的性能相当于90MHz的Pentium。
NexGen芯片的价格比Intel的Pentium便宜不少,因此系统厂家利用Ne586生产出来的个人机,比利用Pentium的每台可便宜好几百美元。例如,带有8M RAM和Nx586-P75的系统,配有340MB硬盘和14英寸彩显时,随出售时的折扣不同,其价格在1645至1850美元之间,与之相当的Pentium系统,其售价则在2000美元以上。
在NexGen技术中,另一个重要特点,便是降低浮点运算性能,因为它认为这并不太重要。和其他586级处理器不一样,Nx586未含有FPU(浮点运算单元)。最初,NexGen曾计划提供单独的FPU。就像Intel为286提供FPU一样。后来,NexGen在其处理器新版本中,系在多芯片的模块中使用CPU和FPU。这些衍变出来的型号已安排在1995年初生产。
为保持同现有的为NexGen芯片而设计的母板的兼容性,多芯片模块同其有一样的针脚。遗憾的是,这意味着最初为连接CPU和FPU而保留的约100个针脚将出现多余的。这些无用的针脚会提高模块的成本。不料,风云多变,正由于NexGen的Nx586设计的针脚不能与Pentium芯片互换,因而采用Nx586的电脑商不如预期的多,使NexGen公司逐渐陷入了销售不畅、资金短缺的困境。又因为NexGen没有独立的制造厂、Nx586要委托IBM公司生产,使Nx586芯片的制造受到制约。相反AMD公司财力雄厚,又有制造芯片的能力,因此在MPU激烈的竞争下,AMD公司于今年10月20日宣布以9亿美元将NexGen公司纳入其麾下。购并NexGen以后,将大大加强AMD公司与Intel抗衡的实力。NexGen的一举成名和昙花一现再次表明MPU竞争的激烈。
? 五、Pentium Pro面目一新
在各MPU厂家特别是x86芯片兼容厂家竞相推出新产品时,英特尔当然不能无所作为。它也在年初发表了继Pentium(奔腾)之后的下一代微处理器P6(现已正式命名为Pentium Pro,中文名为高能奔腾)。按传统的习惯,它便是相当于686的芯片。已在今年11月投放市场。
Pentium Pro使x86微处理器面目一新。它同Pentium比较,有以下新的特点。
(1)CPU内核有550万个晶体管,另外在同一封装里还有1550万个晶体管用作二级高速缓存,即一个封装里总共有2100万晶体管,而Pentium总共只有310万个晶体管。
(2)使用三条超标量的流水线,而Pentium只有二条。
(3)有5个并行的执行单元,用于整型数运算的两个,用于装载、存储和浮点数运算的各一个。而Pentium只有三个并行执行单元。
(4)它的性能在133MHz下可达到200SPECint92,约为现在Pentium性能的一倍。
(5)它的芯片底座面积总共为508平方毫米,即不到Pentium的295平方毫米的两倍,但所容纳的晶体管却为Pentium的5倍。
当然Pentium Pro的功耗也比Pentium高些,在133MHz下,最高可达20瓦。
从技术的角度看,Pentium Pro也是有许多特点的。
第一,一个封装内放两个芯片,一个是CPU本身,另一个为高达256KB的二级高速缓存。这样做出于两种考虑,一是个人机厂家不用考虑CPU和二级高速缓存容量间的匹配问题,二是有助于提高性能。
这种把CPU和二级高速缓存放在一起的独特封装为今后提供更多的设计变化敞开了大门。但是它也使得不容易评价其性能价格比。因为它含有其他芯片都没有的大容量二级高速缓存,这当然使Pentium Pro比它的竞争对手贵。因此如果要进行比较,必须把对手的价格加上相应的二级高速缓存价格才公平合理。
第二,对微结构作了精心安排。不是只要用更多的资源来构成更大的高速缓存、更快的时钟、更宽的总线,以及更多的执行单元和寄存器,便万事大吉。因为如果各部分的能力未能取得平衡,其中多出来的部分资源便被浪费。英特尔花了很多精力作了精心安排,才使各部分的能力得到最佳结合。
第三,将指令分解为微操作。设计Pentium Pro时面临的最大矛盾是要提高性能就要采用RISC方式使指令能够在流水线上并行执行,要保持同以往x86微处理器兼容,就要采用CISC指令,这样才能使x86庞大软件资源能在Pentium Pro上运行。为了解决这一矛盾,一方面仍然采用CISC指令以保持兼容性,另一方面在执行时将指令分解为若干像RISC指令的微操作,使其能在流水线上并行地执行,以提高性能。
第四,采用了乱序执行和推测执行。所谓乱序执行是指不完全按程序规定的指令顺序依次执行。所谓推测执行是指遇到转移指令时,不等结果出来便先推测可能往哪里转移便提前执行,由于推测不一定全对,故带有一定风险又称风险执行。采用乱序执行和推测执行都是为了不使流水线“停工等料”,以提高运算性能。
第五,使用储备站起“交通警”作用。当指令分解为微操作时,微操作都要放到储备站中,由它安排执行顺序,以充分发挥流水线能力。
第六,使用退离单元使其仍保持程序的完整。当微操作执行完毕,由退离单元再将其组合在一起使其退出。从外部看仍是在执行一条条CISC指令。
可以说,RISC肯定是今后发展方向,为了保持兼容性,Pentium Pro煞费苦心解决了这一矛盾,所有x86兼容芯片厂家在发展下一代芯片时,也都采用和这大同小异的方法。
目前个人机主流是使用486/Pentium,性能为100MIPS。Pentium Pro推出后将变为使用Pentium Pro,性能达到250MIPS或更高,内存将达32-64MB、使用32/64位PCI(外围部件互连)总线、1GB硬盘,100Mbps的以太网,并使用DSP(数字信号处理器)实现多媒体功能,可以即插即用,支持语音控制和数字视像,还可进行视像会议。
? 六、合纵连横 扑朔迷离
长期以来,RISC和CISC是各守疆域、井水不犯河水。如今随着RISC要进入CISC传统领地个人机领域,原先MPC领域各种执力分布的格局被打破,各个集团之间出现重新组合的动向。哪一集团能在新的形势下,扩大自己MPU的势力,便能左右其成本竞争力和吸引更多的软件公司为它开发软件,所以是决定其计算机事业兴衰成败的关键。各厂家对此莫不全力以赴。
在各个集团寻求合作伙伴扩大势力中,基本的目的主要有二。一是共同承担开发新芯片的巨额投资;二是扩大产品用途,以便能够大量生产,取得规模效益和降低成本。
在各个集团错综复杂的合纵连横关系中,大体上可理出三大势力,形成鼎足而立的姿态。
目前势力最强大的是英特尔和惠普联盟。去年6月这两家发表将共同开发面向工作站和服务器使用的MPC。英特尔虽然靠庞大的软件资源,还能使其x86维持一段时间的优势,但从长远看它一定要掌握RISC技术,而HP是最早采用RISC的厂家。从HP说,Intel雄踞MPU市场之首,当然是好伙伴,所以它们一拍即合。它们合作的目的固然要争取产品成为今后产业界的标准,但当前更直接的目标乃是减轻开发和制造的投资。
现在要开发一种新一代的MPU,并促使独立的软件厂家为它配齐应用软件,总共要先投资约10亿美元。尽管对大公司这也是沉重负担。惠普现在每年拿出销售额的10%作为开发经费,它相当于20亿美元(MPU研制只能用其中的一部分),英特尔1994年科研经费约11亿美元。虽然都不少,但因开发项目多仍显得捉襟见肘。通过合作更具有开发实力。此外,这两家还在计划在制造方面也要发扬各自优势,分担产品的生产。
除了同惠普合作外,英特尔还在极力扩大其产品用途。如现在大型机出现利用举行处理技术,改用大量MPU作为CPU的动向,英特尔便向这一领域扩充自己势力。它已使某些并行大型机搭载多达600个486DZ和Pentium的芯片。
第二大势力便是IBM、苹果、摩托罗拉组成的Power PC联盟,它们一开始便是以要战胜英特尔为目标,而且要使自己的产品用于从个人机到巨型机的广泛范围。
Power PC的性能价格比已远超过英特尔的产品,关键在于要有足够的配套软件。它给英特尔巨大威胁,但真正要战胜它还要克服不少困难。
当前的MPC领域,可以说是英特尔和IBM两大势力之争。在这两大势力夹缝中求生存、求发展其他集团,人们把它统称为第三势力。第三势力各个集团之间不仅无明确的合作关系,甚至连默契也没有。它们之间也还在竞争。
第三势力以Sun为首的SPARC集团、MIPS为首的MIPS集团、DEC为首的Alpha集团为代表。人们用这三家产品的第一个字母,把第三势力总称为SAM。SAM中以Sun的实力最强。
Sun认为MPU领域竞争的结果,今后只能剩下英特尔、IBM、Sun三家。它根本不把MIPS和DEC看在眼里。它这样说当然不是毫无根据,因为它一家便独占RISC芯片40%左右,而且从1989年起已在工作站领域保持六连冠。然而工作站产量占个人机的六十分之一。所以Sun知道今后要发展不能只停留在工作站领域。它的Ultra SPARC为它扩展经营范围提供了锐利武器。
MIPS因经营不善被SGI所收买,SGI是以图像处理为主的计算机公司,这使得它对面向商业用途的大型服务器不感兴趣,而商业用途具有最大市场。所以MIPS集团为内部的DEC都对它只给以65分的评价,而且出现了离心倾向。但是它将利用其卓越的图形功能,往家用游戏机领域发展,索尼已决定在其游戏机中采用MIPS芯片。
DEC的Alpha芯片虽然性能最好,但因软件不够多和价格较贵,因而业绩不佳。它一直为缺乏开拓市场的能力而苦恼。现在日本DEC只好靠自己促销搭载Alpha芯片的产品以开拓需要。美国DEC也进行了大规模的机构调整和裁减人员,而且去年还发表了世界上最高速的RISC MPU即Alpha芯片21164。尽管采取了这许多反击措施,但DEC的前景仍是严峻的。