Wildcat II 极速野猫
#1 Wildcat Ⅱ功能一览
Wildcat Ⅱ 5110是3Dlabs的新旗舰系列Wildcat Ⅱ的第一项产品,脱胎自被收购下来的Intergraph公司的Wildcat系列产品。Wildcat Ⅱ 5110虽然是芯片组产品,但内部包括了两条完整的3D图形处理流水线,每条拥有一个全新、优化的几何加速器(相当于专业化的T&L引擎)和一个光栅化引擎(相当于专业化的多纹理渲染结构);它的显示内存分成独立的帧缓存和纹理缓存,共计144MB;为目前最强大的Pentium 4 CPU做了彻底优化,使用了AGP Pro 4×接口;完整支持OpenGL 1.2的所有功能,包括3D体积纹理贴图、全屏反锯齿等等;有了多条3D图形处理流水线,当然能够外接多台显示器,标准的配置是VGA+DVI-I。
如果查阅老一代的Wildcat 说明书,你就会发现Wildcat Ⅱ在功能上只有很少的变化,但是它的优点就是──快!Wildcat Ⅱ 5110的性能是Wildcat Ⅱ 4110的约两倍,但是价位却相近。我们先看看OPC最近推出的Viewperf 6.1.2专业版OpenGL性能测试软件的结果,正是Wildcat Ⅱ 5110创造了这些世界纪录:(^09030101a^)
其中配合Wildcat Ⅱ 5110和FireGL 2的是1.5GHz的Pentium 4,Quadro 2 Pro用的则是1.4GHz的,至于我自己的TNT2 Pro加上超频900MHz的Celeron Ⅱ测出的成绩,是为了让我们一眼就能看出近年来3D显示芯片的进步有多么大。而Wildcat Ⅱ尽管只有3.32亿像素/秒的填充率,竟能在所有的项目中全部夺魁,确实令人惊讶。
Wildcat Ⅱ面向5个大类(几乎就是全部)的专业用户:机械CAD、可视化科学计算、医学成像、视觉模拟和可视化建筑设计。将在今年秋天上市的Wildcat Ⅱ 5110暂时不会有零售版本,因为这类顶级显示卡只有装在一流的工作站上才能发挥优势,3Dlabs的主要合作伙伴包括Compaq、Dell、富士通、富士通-西门子和IBM,连自己生产VISUALIZE fx系列高档专业3D卡的HP也选用了5110,可见Wildcat Ⅱ目前的“无敌”地位。
#1 Wildcat Ⅱ架构详解
ParaScale并行架构是所有Wildcat 显示卡的基石,正是由于有了这种模块化的架构支撑起从几何处理到光栅化的全部3D流程的硬件加速,Wildcat 产品才能实现性能的成倍增长,也就是说从1991年最初的Wildcat 到现在的Wildcat Ⅱ 5110,3D性能已经翻了两番,兼容性却始终如一。
ParaScale的精髓在于模块化和并行化,灵活配置的Wildcat 和Wildcat Ⅱ芯片组既功能强大、又伸缩自如。Wildcat I/Ⅱ显示卡主要由3片ASIC类型的IC构成:总线接口芯片,使用了DirectBurst专利技术,可以将3D图形子系统同系统总线无缝连接,不论通过AGP还是PCI总线均没有问题;几何加速器芯片,Wildcat 的单个芯片就能达到3.2G FLOPS的浮点运算能力,内部集成了950万晶体管;光栅化引擎芯片,包括了三角形设置、纹理处理和所有的像素级操作,同时集成了10bit的RAMDAC(可以达到30位的总色彩精度),另外完全分开的帧缓存和纹理缓存可以独立存取,大大提高了显示内存的带宽及其利用效率。
ParaScale架构不但具有分离的几何和光栅化部分,而且可以将多条3D流水线(多套Wildcat 芯片组)合而为一,结果是线性增长的处理能力:2套芯片组是2×(2倍速)、4套就是4×(4倍速),而且合并处理能力的工作完全由硬件和驱动程序来完成,对于应用软件和用户来说除了成倍增长的速度,完全没有其他变化。另外多条3D流水线既可以完成同一个显示任务,也可以被分派处理同一个软件甚至不同软件输出的不同图像。ParaScale架构还有一个最重要的优点就是可编程性,不论是几何部分还是光栅化部分,都是由执行“微代码”的准通用型内核构成,这同当今的CPU架构类似,只不过是由驱动程序来完成普通指令向“微代码”的转换过程。可编程型3D流水线的优点不言而喻,Wildcat可以完全支持各种图形API,从目前最新的OpenGL 1.2到未来微软的DirectX、OpenGL二合一的Fahrenheit都没有问题。相对于3Dlabs自身的Gamma G2几何芯片和Glint R3/Permedia 3光栅化芯片的硬连线结构,Wildcat 系列的主要优势就在于此,连NVIDIA近期的主要目标也就是实现3D显示芯片的完全可编程化,也就无怪乎3Dlabs会斥巨资买下Intergraph,并把Wildcat 作为自己旗舰产品的商标。
Wildcat不但率先在Windows NT工作站上引入硬件几何加速、达到了100万三角形/秒的处理速度,而且连FSAA(全屏反锯齿)、3D体积纹理、像素级的3D效果、硬件Occlusion Culling(剪除不可见图形,类似于主流芯片的HSR隐面去除)以及32位的纹理、Z-buffer和渲染输出也都是Wildcat在NT平台上的“第一”。其中3D纹理和HSR是比较先进的技术,还需要一段时间才能在主流3D应用中实用化,而最引人注目的是SuperScene全屏反锯齿功能。
SuperScene采用的是在较高分辨率下渲染,再将结果通过多点混合生成较低分辨率下的反锯齿图像,这与NVIDIA、ATI采用的超取样方法完全一致。为了进一步提高SuperScene水平,Wildcat的内部硬件采用了多种独特的技术:首先每个像素所作的多个取样(通常多达4×4=16个,这也是专业水准高于主流标准的表现);其次为了让这个多边形看起来不是那么“平板”,需要对各个取样点的坐标做些细微调整;最后为了节省取样渲染过程中需要的“巨量”内存空间,动态内存分配功能可以根据需要只存储那些必不可少的数据(往往处于那些色彩变化剧烈的边缘部分),因此即使16×的FSAA也只需要3~4倍的存储容量,既加快了速度、又降低了成本──这些技术让Wildcat得以在中低价位的NT工作站上实现10万美元级工作站都难以企及的16×取样、真正专业级的SuperScale全屏反锯齿功能。看起来这些专利技术同3dfx抖动取样FSAA算法有几分“神似”。其实不仅是FSAA,主流3D显示芯片在不少3D功能上“偷工减料、不求上进”,要赶上专业3D芯片组的精度和深度,还有很长的路要走,主流3D必然从速度至上转变到质量/速度并举的发展轨道上来。
#1 Wildcat Ⅱ带来什么
3Dlabs推销Wildcat Ⅱ 5110时的口号就是:速度+质量+功能=生产力,无疑在保证一流图形质量和完备3D功能的前提下,速度的成倍提高直接等同于工作效率的大幅上升。在价位不变的情况下,Wildcat Ⅱ无疑是专业人士梦寐以求的超级“摇钱树”。
以NVIDIA为代表的主流厂家则一方面向专业厂家学习尖端技术、参照发展方向,另一方面凭借巨大的市场实力试图攻占专业市场。本来NVIDIA的Quadro2 Pro性能接近于FireGL 2的水平,算是“准一流”的专业芯片。如今Wildcat Ⅱ 5110一出,其他显示卡都只能退居“二线“;等NV20GL(可能称作Quadro3,因为NV20是GeForce3嘛)现身时,Wildcat Ⅱ还可以推出“2×”的6110之类予以还击(毕竟成本在专业领域不是主要问题)……在这场竞争中NVIDIA的优势仅仅是产品升级速度快、价格低廉。也许某一天主流3D显示卡从亦步亦趋转变成用于超越专业产品,到那时才是NVIDIA、ATI等公司开拓3D未来、改写3D历史的关键时刻。