英特尔的秘密武器——Katmai

Author: 徐舒 Date: 1998年 第40期 33版

  前一段时间,AMD推出的K6-2出尽了风头,作为业界龙头老大的英特尔对此当然无法容忍。她一面推出了针对低端市场的赛扬,一面加紧了CPU的升级,并于日前向业界透露了即将推出的奔腾Ⅱ-Katmai CPU的信息,包括Katmai的70条新增指令的细节和Katmai/Tanner的结构。在新增指令中,大多数指令是针对提高电脑游戏的性能而设计的。这些新指令提供了SIMD-FP技术,即采用单指令多数据方式来处理单精度浮点值。由于CPU芯片的浮点运算性能对游戏的表现具有决定性的作用,所以SIMD-FP对于游戏性能的提升是不言而喻的。虽然AMD的3DNow!也采用了类似技术,但英特尔采用了一种更为成熟的方式来实现SIMD-FP,下面一一列举:
  1.采用8个新的128位单精度寄存器(4×32位),能同时处理4个单精度浮点变量,可达到每秒20亿次浮点运算的速度。现在尚不能确定Katmai是采用1条还是2条SIMD-FP管线结构,如果采用2条SIMD-FP的话,Katmai将能在每秒内完成40亿次浮点运算,而AMD的K6-2仅装备了8个64位单精度寄存器(2×32位)。
  2.为了充分发挥这些寄存器的优势,英特尔又引进了新的“处理器分离模式”,这是英特尔继十多年前引入386模式以来又一次推出新的处理器模式,新的处理器模式需要操作系统的支持,为此,英特尔将推出Windows98的补丁程序,而WindowsNT 5.0将直接支持该模式。
  3.新的处理器模式允许并行使用SIMD-FP和MMX或SIMD-FP和IA-FP双精度浮点代码。自从MMX和标准IA-FP使用相同的寄存器以来,还不能同时使用MMX和SIMD-FP,但这对于Katmai来说已不再是问题,而K6-2尚不能同时使用3DNow!和标准双精度浮点单元。
  Katmai的这些特点将极大提高游戏的3D表现,而且在对声音的处理上(如语音识别、环绕立体声、AC3等),也将因为新指令的引入而有所提高。著名的芯片专家Andreas Stiller认为Katmai所采用的SIMD-FP结构与AMD有很大的不同,新的处理器模式及增加的8个128位寄存器是3DNow!所实现不了的。
  AMD采用8个64位宽的寄存器,因此,在同一时刻同一管道线只能进行两次单精度浮点操作,而Katmai每条管线能同时进行4次操作。K6-2拥有两条管线,因此Katmai必须装备两条SIMD-FP管线才能具备两倍于K6-2的优势。但Katmai的SIMD-FP是建立在P6那大大快于K6的浮点处理结构的基础之上的,所以Katmai将明显快于K6-2也就不足为奇了。
  除此之外,英特尔在原有的MMX指令集的基础上加入了一些新的指令,这将使CPU在多媒体的表现上显得更加得心应手。
  Katmai还采用了新的内存流式传输结构,这一新的特点改进了P6的总线,通过在CPU运行时,经由一个新的预读取结构,把存在于内存中的结果隐藏起来。它能在不占用CPU管线的前提下产生多传输请求,避免了一次性写入数据对CACHE造成的浪费。它不仅能提高操作系统、服务器和工作站应用程序的运行速度,而且还能对MPEG2的编码、解码进行加速。英特尔希望新的内存流式传输结构能够将CPU的性能提升5%~20%。
  可以预见,Katmai将会对3D游戏的效果带来戏剧般的提升,至少可以带来像K6-2引入了3DNow!那样的变化。Katmai的确值得期待!