穷人的劳斯莱斯——剖析GeForce2 MX图形芯片

Author: Cloud Date: 2000年第27期

　　6月28日NVIDIA终于公布代号为NV11的3D芯片，并把它正式命名为GeForce2 MX。让我们意外的是，GeForce2 MX并未像原来计划的那样成为特殊版本的GeForce，而是作为一块面向主流市场的GPU，不但有GPU的高速度、而且具备占领主流市场的中档价格。
　　GeForce2 MX集成了与GeForce2 GTS相同的第二代T＆L引擎和先进的单周期7操作明暗引擎，而且集成了NVIDIA最新的双显示器和图像加强技术；尽管GeForce2 MX的渲染流水线数目只有GeForce2 GTS的一半、工作频率也只达到175MHz，且只能使用64位接口的DDR SDRAM和128位的SDRAM，但GeForce2 MX最大的优点是价格便宜——32MB的成品显卡仅为GeForce2 GTS的40％，大概在119美元！凭借超过GeForce256普通版的性能及与TNT2 Pro相近的价格，GeForce2 MX的目标是以普通人可以接受的价格、尽量普及带有T＆L功能的GPU再度分割市场，因此称它为“穷人的劳斯莱斯”并不为过。（^27030101a^）
#1    高性价比的GPU
　　GeForce2 MX具有两条双纹理的渲染流水线，因为使用0.18微米工艺能够工作在175MHz，峰值渲染能力达到7亿图素/秒，即为GeForce2 GTS的43.8％，大大超过了GeForce256的4.8亿图素/秒，不同的是GeForce2 MX在二重纹理的场合更能彻底发挥。正式版的ATI Radeon 256尽管有12亿图素/秒的渲染能力，但在通常的二重纹理时只不过达到8亿图素/秒，而且Radeon 256有比GeForce2 GTS更复杂的结构，属于高端产品；ST的KYRO STG4000的7.5亿图素/秒也与此类似，不同的是KYRO有同GeForce2 MX差不多简单的结构、价格也很便宜，很可能是GeForce2 MX的劲敌；3dfx的Voodoo5 5500双芯片并联也只达到6.7亿图素/秒，它也拥有两条双纹理的渲染流水线，但恐怕不是GeForce2 MX的对手（相对而言Voodoo5 6000就贵得可怕了）；至于Voodoo4、S3的Savage 2000系列、Matrox的G450都只能同GeForce256比试。有强大的渲染能力作后盾，GeForce2 MX具有GeForce2 GTS的各种3D渲染特性，例如NSR明暗引擎、高质量的FSAA和立方环境贴图等。
　　而在渲染阶段最大的问题是显示内存带宽不足，GeForce2 GTS尽管用到128位166MHz的DDR SDRAM，也只有5.3GB/s的带宽，仍嫌不足。GeForce2 MX的128位166MHz的SDRAM，虽然只有2.7GB/s带宽，但因为渲染能力还不到一半，所以理论上说带宽问题比GeForce2 GTS有少许改善。GeForce2 MX支持先进的接口：AGP 2×/4×，这方面不会成为系统瓶颈。
　　GeForce2 MX的第二代T＆L引擎同GeForce2 GTS完全相同，仅仅因为工作频率较低而只有80％的性能——2000万经过处理的三角形/秒，而且看来NVIDIA的第二代T＆L引擎已经解决了内部传输率不足的问题。但至今为止完全掌握、并能有效应用T＆L技术的厂家仍然不多。
　　GeForce2 MX不但在游戏中速度和质量上都接近于GeForce2 GTS（因为多数游戏不能充分发挥它们的能力），而且在专业测试中的结果也很接近，堪称高性价比。GeForce2 MX还有一样GeForce2 GTS不具备的优点，就是超频能力，因为用同样的工艺制造，GeForce2 MX的结构相对简单（约只有GeForce2 GTS的2500万晶体管数的一半），发热量只有4W，因此至少能同样工作在200 MHz，如加强散热的话则更容易再往上超一些，极限纪录可达到220MHz～230 MHz。超频时应首先考虑超显存，GeForce2 MX搭配的新SDRAM一般能接近200 MHz，运气好也许能达到210MHz～220 MHz。
#1    增强的显示功能
　　GeForce2 MX也带来了两种实用的新显示功能，这同它面向大众的市场定位相符合。
　　首先是Twin View，它是类似于Matrox的双头显示的功能（恐怕GeForce2 MX比G400还便宜），能够同时连接普通CRT显示器、电视机、数字液晶显示器或模拟液晶显示器等种类的某两台显示设备。GeForce2 MX也具有比较完善的视频输入、输出，以及DVD视频解码辅助功能。在购买时应当注意显示卡是否支持Twin View显示（包括电视输出）和视频处理的功能，不同配置的GeForce2 MX在售价上还是有明显差距的。
　　Digital Vibrance Control（Vibrance是有活力的意思）则是第一次见到的特殊功能，作用是使各种电脑图像更锐利、明亮和干净。这一专利技术不但对显示器上的图像有效，而且对电视、LCD显示器也有效，用户可以对显示芯片内部的图形子系统传输到显示子系统的数据流进行详尽的控制。nVidia表示Digital Vibrance Control只是一种软件，那么显然也能被使用在GeForce系列的其他产品中，TNT2系列能否使用就要看内部结构了。nVidia无疑使用这种改进的Gamma控制功能来进一步提升GeForce2 MX的价值，使它更适合主流市场的需要。
#1    市场定位
　　GeForce2 MX仍使用nVidia独特的统一结构驱动程序，这保证了从Riva TNT开始的产品的前向和后向兼容性，这在3D行业飞速发展的今天是相当不容易的。GeForce2 MX对DirectX和OpenGL的支持都是完整而且优化的，支持几乎所有的3D特性。
　　从正式公布开始的数周内，GeForce2 MX显示卡就将全面上市，GeForce2 MX推出后，nVidia的产品从低到高全面铺开：Quadro负责专业工作站、数字创作、CAD领域；GeForce2 GTS和GeForce256面对PC游戏发烧友阶层；GeForce2 MX面向大公司使用的桌面系统的主流市场；TNT2 Pro主要用于要求高性价比的中低端市场；Vanta、Vanta LT和TNT2 M64面向廉价的商用和家用市场；最便宜的Aladdin TNT2主板芯片组，适合最廉价的PC。整个战略中GeForce2 MX位于中段，承担了极其重要的任务。
#1    未来的NV20和NV25
　　nVidia将在10月或者11月推出的NV20，它具有划时代的复杂结构和处理功能；如果nVidia始终能够坚持6个月一次的升级节奏，明年5月就是NV25的天下了，这一款下一代GPU战胜了GigaPixel（现属于3dfx）的Giga3D GP－3成为微软将于明年推出的新游戏机X－Box的图形核心：X－Chip，它在NV20的基础上进一步提高了生产工艺和3D速度。
　　NV20仍使用0.18微米工艺，在集成5000万晶体管的情况下芯片面积是GeForce2 GTS的2倍，发热量不会小；NV20的核心频率同样是200MHz，通过8条4重纹理流水线达到8000亿操作/秒和64亿图素/秒；NV20的T＆L能力进一步提高，将有1.5亿小多边形（或称作“粒子”）/秒，估计相当于5000万三角形/秒，这可能预示NV20第一次正式支持PS2那样的粒子系统，另外它硬件支持比PS2更多样化的各种高次曲面，比如Nurbs、H＆B取样面、Tensor拼图、细分曲面等；NV20还支持高达8×、16×的FSAA（估计是4纹理的流水线帮助），以及DirectX 8的Tessellation和Decimation操作，支持DirectX 8和OpenGL的所有特性。
　　NV20继续使用200 MHz的DDR SDRAM，性能成倍提高后外部带宽将十分紧张，所以不得不采用了类似KYRO那样的隐面去除技术，通过不渲染不可见的表面来提高显存带宽的利用率。看来这像是市场策略，因为如果不采取措施，NV20的实际表现将同GeForce2 GTS差不多；有了隐面去除，在图像重叠程度达到3倍的游戏中，NV20能把速度至少提高到3倍。
　　NV25的生产工艺提高到0.13微米（同样结构下芯片面积比0.18微米缩小一半），能工作在300MHz的核心频率，但是16条4重纹理的流水线把总晶体管数提高到1亿左右，也使渲染能力提高到有些令人怀疑的192亿图素/秒（真不知道工作在200 MHz 的GP－3如何能达到256亿图素/秒？即使是乘了4倍重叠程度的等效值也需要8条4重纹理的流水线），T＆L速度是900万～1000万三角形/秒，同样支持FSAA和S3TC。从这些粗略、甚至可能有些水分的数据中，我们也能看出X－Box的3D能力比PS2强多少；谣传PS3将采用AMD的CPU和3dfx的GPU、新DreamCast也将采用带T＆L的3D芯片组，但是对于最终用户，两年升级一次的游戏机同PC又有多大差异？
#1    结　语
　　目前NVIDIA的系列产品中，其同一技术水准上的第2代产品看起来更有选择的意义，如TNT2（特别是新工艺的Pro版）、GeForce2 MX（GeForce2 GTS太贵）和将来的NV25。因为提升3D水准的头一代产品难免会出现这样那样的缺陷，而且不惜工本制造出的新一代产品肯定昂贵。微软显然不笨，所以选择了NV25而不是NV20。
　　我们现在面对的GeForce2 MX，凭借仅为GeForce2 GTS40％的价格、50％的渲染性能、80％的T＆L性能和0.18微米卓越的超频能力，必将很快成为囊中羞涩的国内发烧友们的爱物（GeForce2 GTS的廉价替代品？）。毕竟TNT2太老了、也不太便宜，GeForce256既昂贵、又耗电、还特别热，SDR版的肯定不如GeForce2 MX，买得起DDR版GeForce256的用户还不如直接用接近天价的GeForce2 GTS 64MB DDR。