3D奇兵GP—1

Author: 朱云 Date: 1999年 第50期 17版


  今年的COMDEX大展,一款新型的3D图形加速芯片GP-1出现在PC的游戏应用中,它在演示中表现出的性能甚至可以与Voodoo3、G400或Geforce256等主流3D芯片一争高下。研发这款GP-1芯片的GigaPixel公司从1997年成立时开始,就致力于将SGI图形工作站级的3D图形质量与性能带入主流市场。它在技术上只有一个选择,就是改变传统的3D硬件架构,使用创新的3D处理方式发挥最佳的性能。
  同近年来涌现的无数电路或IC设计公司一样,GigaPixel采用设计同生产相分离的模式,自己并不生产和加工3D芯片,连提供给最终用户的IC设计也不打算完成——GigaPixel的产品只是提供3D核心的设计,这也称作IP(知识产权)内核。现在欧美十分流行的IP操作模式是随着IC规模的不断增大,设计、生产周期的不断缩短和单芯片系统(需多个公司的技术融合)的不断增加而产生的,像GigaPixel这样专注于技术水准的提升,而把上市产品的设计、生产和市场方面的工作交给更有专长的下游公司去做,这对规模较小的设计公司无疑是较好的选择,这在3D图形硬件市场上尤其重要,因为就算像Intel这样实力近乎“无敌”的公司在3D硬件方面也同样遭遇了挫折。
#1  一、与众不同的GP-1核心技术
  由于GigaPixel公司的GP-1设计思路不同于现在主流的(或传统的)3D加速芯片,因而在技术上有众多的不同之处。
  1.IP内核技术。GP-1是一种3D加速芯片的IP内核技术,它可以被其他厂家用来设计、生产完整的2D/3D/视频芯片,甚至整合型主板芯片组。GigaPixel公司只负责芯片技术的发展、提供驱动软件和向软件(游戏)公司推荐其GP-1系列产品;但使用GP-1内核的公司必须添上自己的2D和视频部分。由于提供了IP内核,各公司在GigaPixel的帮助下可以设计出核心相同、但功能与市场定位各异的芯片,而且开发过程缩短,厂商能够在较短的周期内推出和升级其产品。(^501701a^)
  2.先进的分块渲染、隐面去除技术。从目前3D芯片技术的发展我们已经看到,3D系统的带宽和复杂性是传统3D体系结构发展的客观障碍,这也是为什么nVidia的GeForce 256芯片的复杂程度已达到2倍于Pentium Ⅲ处理器的难度,由于128位的显示内存接口的带宽限制了内核性能的发挥,仍被指责为“填充率太低”;为什么Bitboys超过1.2G~1.4G Texel/s的Glaze 3D芯片不得不使用512位的嵌入式内存作为Cache;S3的Savage 2000同GeForce 256一样要用到高速的DDR DRAM来提升显示内存带宽。要解决上述问题,最根本的方式就是改变体系结构,像Videologic的Power VR S1/S2两个系列、Stellar使用PixelSquirt结构的VelaTX、微软的Talisman设计(Fujitsu和Trident都试图使用)就是这方面的先锋。
  GP-1也并非是第一个采用分块渲染、隐面去除技术的产品,但较为出色的是它解决了以往产品的最大问题:同传统体系结构的兼容性。GP-1先将要渲染的场景(显示屏幕或窗口)分成若干个小块,目的是降低数据量,使内核可以直接存放当前数据而不必频繁访问显示内存和主内存,同时因为处理的简化而使内核复杂程度减小,使并行处理成为可能。并行处理既补偿了逐块处理带来的速度减慢,又有可能进一步提升速度;然后GP-1决定当前块中哪些多边形是可见的,而将不可见的多边形去除,这样它就不用在那些看不见的东西上浪费哪怕一点时间;最后才是传统的渲染过程,包括完整的三角形设置、明暗涂色、纹理贴图和半透明混合几个步骤。所有这些工作完全是内部硬件操作完成,从软件角度看,这一切均被封在“黑盒”中,就像在使用一个普通的3D内核一样。
  3.完善的3D特性。GP-1结构的主要优点是它将3D图形系统的带宽需求降到了原有的1/10(最低值),并大大降低了需要处理的数据量,相应IC的逻辑门数据量也同时大大减少。在其他方面,GP-1同主流的3D加速芯片完全没有两样。比如说,GP-1使用的API与Direct 3D和OpenGL均完全兼容。3D特性有32位真彩色渲染、三角形组成的条与块渲染、镜面高光和漫反射明暗涂色、基于顶点的雾化、128位内部数据通道、支持各种类型的内存芯片和支持x86及其他类型的CPU等等;比较特殊的是GP-1还支持3dfx的T-Buffer那样的无损速度、高质量的抗锯齿功能(Anti-Aliasing),另外GP-1还支持集成在芯片中的24位Z-Buffer,并可以再次读出,这样就同普通的外置在显示内存中的Z-Buffer没有什么不同了。
#1  二、GP-1与其它3D芯片的特性比较
  虽然像GP-1芯片采用这样的特殊方法进行渲染的3D加速芯片不多,但各有各的特点和长处,下面我们从分块渲染、隐面去除、片上Z-Buffer、纹理压缩、抗锯齿功能和2D/视频等几部分功能来进行相对深入的比较。
  1.分块渲染。这是非主流的3D芯片的主要共识:PowerVR S1系列使用软件进行分块(32×1像素的块),由于必须依赖于CPU的处理,运行效率较差;PowerVR S2系列改为硬件分块引擎(32×16像素的块),速度已经和传统架构的芯片性能相当;VelaTX使用的块就是单个像素点,采用128路并行结构;Talisman设计则仅仅肯定了分块渲染的重要性,并未公开具体的实现细节;GP-1使用的是硬件实现分块功能,而且完全兼容现有的和将来的软件。
  2.隐面去除功能。隐面去除功能的实现基本都是通过图形排序,来确定相互之间的遮挡关系,这里面半透明排序是个难点:PowerVR S1系列使用无限大平面来排序,用软件实现半透明排序,实际效果并不明显;PowerVR S2系列也使用无限大平面来排序,用硬件执行半透明排序;VelaTX使用的是像素点排序;Talisman未提到这个要点;GP-1用的是传统的多边形为单位的排序和硬件半透明排序,解决了以往的难题,也提高了兼容性。
  3.片上Z-buffer。Z-Buffer功能可以大大节省带宽(约占总通信量的一半),但PowerVR系列、VelaTX和Talisman都是完全取消了Z-Buffer功能,这使得一些依赖Z-Buffer实现的3D特效难以实现。GP-1的改进是让片上Z-Buffer不但可以写入还能够读出,从而使芯片的3D特效有所改观。
  4.纹理压缩。纹理压缩也可以充分节省系统带宽,Talisman采用的技术可达到1/8~1/12最大压缩率;PowerVR S1没有纹理压缩功能;PowerVR S2使用符合DXTC标准的VQ方式可达1/8的最大压缩率;VelaTX也符合DXTC标准;GP-1在这一点上有些不足,未支持纹理压缩(可能到DXTC被广为采用时再加上也未可知)。
  5.抗锯齿。抗锯齿功能直到3dfx最近在Voodoo 5中采用才为大家所重视,实际上全景抗锯齿(与较简单的边缘抗锯齿不同)所要求的超大像素填充率,对这些新型3D芯片来讲并不是什么难事,PowerVR S2和VelaTX早已有了(Talisman未表态),GP-1自然也轻易实现了全景抗锯齿。
  6.2D/视频。对于完整的显示卡系统来说这两个方面是必不可少的:PowerVR S1系列是3D附加卡,没有2D/视频部分;PowerVR S2系列有完善的2D和DVD动态补偿;Talisman本该有全面的3D/2D/视频功能,但产品中一直没有被开发出来,我们也无缘得见;VelaTX是用来与2D/视频芯片协同工作的纯3D芯片;另外PixelSquirt结构的IP内核也提供给其他厂家使用;GP-1是纯3D内核设计,但可以由其他厂家在做成显示卡时加入2D/视频的支持。
#1  三、结论
  GigaPixel GP-1的优点是非传统的3D结构和完善的兼容性带来的高性价比产品(IP的灵活性也可部分看作优点);它的缺点是需要他人采用其IP设计,而很多3D芯片大厂大多不会这么做,同时还缺少2D和视频部分以及T&L几何与光照加速,尽管对于高性价芯片T&L并非必须。但相对传统、复杂、昂贵的GeForce 256和Savage 2000图形芯片,GigaPixel GP-1正是另一个极端——新颖、简洁、廉价。至于用户能不能认同它,就得看市场的“自然”选择了。