AGP十年
特别策划
编者按
自1996年7月诞生至今,AGP规范已走过了10年的发展历程。其间,我们一起目睹了它登场之初的青涩蹒跚,也见证了它壮年时期的数次革新。在日渐强大的PCI-E的面前,AGP如今已呈老迈之态。但不可否认,它曾经带给我们许多快乐和激情,也带来了一波接一波的震撼。对于这一点,3D游戏玩家和专业图形制作的朋友应该是感受最深的。AGP总线作为一种局部总线,它在一定程度上缓解了高速图形数据交换对整个系统总线的压力,但它终归是一种治标不治本的解决方案。随着计算机技术(尤其是CPU、内存、显卡)的高速发展,旧有的系统总线架构已经无法满足技术发展的需要。PCI Express取代AGP是大势所趋,AGP即将完成自己的历史使命。
AGP十年发展史既是一项技术变革史,也是一部图形芯片厂商的沉浮史,尽管那些曾经的巨人们一个接一个地倒下了,但它们也留下了许多经典的传奇。请让我们永远记住这个伟大的名字——AGP。
天降大任——AGP规范的诞生
随着图形技术的发展,到1996年人们对计算机的3D图形处理能力提出了更高的要求,尤其对游戏产业而言,当时的PCI总线已经无法满足3D游戏引擎对图形的处理和数据的传输要求。我们知道,计算机在处理3D图形时需要与CPU和系统内存进行大量的数据交换,例如,在处理1024×768分辨率的画面时,显示芯片与系统之间的数据传输率可达533MB/s,而实际上PCI总线只能保证133MB/s的理论极限带宽。而且这可怜的133MB/s带宽还要分给网卡、PCI声卡、SCSI设备等使用。
不仅如此,3D游戏中的3D建模物体还需要大量的各种纹理贴图或渲染,而且纹理的尺寸越大,图形就越逼真,这些纹理数据不仅需要传输,还须借助显存进行保存。在当时即便是最高级的“3D加速卡”(如Diamond Viper330、3dfx 的Voodoo2等)也只有4MB~6MB显存。对于这些显卡来说,要让3D游戏以800×600以上的分辨率运行是不可能的。
为了解决PCI总线数据传输率低、显存容量不足的瓶颈,Intel在1996年提出了AGP规范,到1997年随着Intel的440LX主板芯片组问世,AGP开始了真正的商业应用。AGP是Accelerated Graphics Port(加速图形接口)的缩写,它是在PCI 2.1的标准上建立起来的。与PCI总线不同,AGP是点对点连接,即只连接控制芯片和AGP显卡,是一种局部总线。
AGP规范为解决计算机图形瓶颈问题采取了多种技术措施,其中最主要的两点是:1.建立显示控制单元(显卡)与系统之间的专用信息高速传输通道;2.通过DME(Direct Memory Execution,直接内存映射操作)技术将系统内存虚拟显存,以扩大显存容量。
小知识:DME技术
DME技术就是让图形芯片通过主板芯片组对系统内存进行直接操作,利用地址映射方法将系统内存模拟显存,以存储大量的数据。AGP技术允许图形控制器占用高达64MB甚至128MB的内存,当然此时计算机必须具备较大内存容量,图形芯片占用的系统内存容量和时间是随机的,它可以在不需要时立即归还给系统。DME技术在AGP技术出现的早期是很有诱惑力的,但随着显示技术的飞速发展,显卡上的显存容量越来越大,从32MB、64MB一路攀升到256MB甚至512MB,所以DME技术的重要性大大下降了。
我们知道,PCI总线的时钟频率一般为33MHz,数据总线位数是32bit ,PCI总线的有效数据传输速率的极限值为33MHz×32bit÷8≈133MB/s,这就表明图形卡与系统之间数据交换的最高带宽不能超过133MB/s,如果考虑到并接在PCI总线上的其他外设占用传输通道的话,用于图形数据传输的带宽更低。
AGP总线直接以66MHz的系统外部时钟频率进行数据传输,所以在同样使用32bit数据总线的条件下,AGP 1×的总线数据传输速率为266MB/s。而AGP 2×虽然工作频率仍为66MHz,但它使用了类似于DDR内存工作方式,即利用一个时钟周期的上升沿和下降沿各传送一次数据,使传输带宽加倍,这样AGP总线在一个时钟周期内被触发两次,而这种触发信号的频率为133MHz,于是AGP 2×的传输带宽就达到了266MB/s×2≈533MB/s。此后的AGP 4×仍使用了这种信号触发方式,只是利用两个触发信号在每个时钟周期的下降沿分别引起两次触发,从而达到在一个时钟周期中触发4次的目的,这样理论上它就可以达到266MB/s×2×2=1064MB/s的带宽。同理,在AGP 8×规范中,触发信号的工作频率将变成266MHz,两个信号触发点也变成了时钟周期的上升沿和下降沿,单信号触发次数变为4次,这样它在一个时钟周期所能传输的数据就从AGP 1×提高了8倍,理论上的传输带宽就达到266MB/s×4×2=2128MB/s的速度。这么高速的数据通道对显卡上的图形控制芯片和CPU、系统内存之间的数据交流已经没有任何阻碍了。
另外在AGP规范中,对内存的读写操作实行流水线处理充分利用了等待的延时,大大增加了读内存的速度。而且AGP规范中总线上的地址信号与数据信号分离,一方面充分利用了读写请求与数据传输之间的空闲,使总线效率达到最高;另一方面可有效地分配系统资源,避免了死锁的发生。
AGP规范可以使系统得到足够宽的数据传输通道和足够大的容量保障,从而确保了3D处理的速度需求,得到了用户的认可和整个业界的追捧,AGP作为一种通用的技术规范展示了它的十年辉煌成就!


光辉重现——AGP显卡发展回顾
AGP 1.0
关键词:
66MHz、266MB/s、533MB/s、3.3V
代表产品:
3D Rage Pro、Riva 128/ZX、SIS6326、i740、Riva TNT、Savage3D、Voodoo Banshee等。
点评:
AGP 1.0是在PCI 2.1规范基础上经过扩充和加强而形成的新一代图形接口标准,它在一段时间内基本满足了显示设备与系统交换数据的需要。
技术解读:
AGP接口的发展经历了AGP 1.0(AGP 1×和AGP 2×)、AGP 2.0(AGP Pro和AGP 4×)、AGP 3.0(AGP 8×)等阶段。1996年7月AGP 1.0标准问世,分为1×和2×两种模式,数据传输带宽分别达到了266MB/s和533MB/s。AGP 1.0规定,AGP显卡的工作频率为66MHz,工作电压为3.3V。虽然AGP标准早已提出,但直到1997年Intel发布支持AGP的440LX芯片组后,主板上才开始出现AGP插槽。在所有支持AGP 1.0规范的芯片组中,Intel的440BX毫无疑问是最经典的产品。
经典回放:
3D Rage Pro

1997年4月ATI发布了第一款AGP显卡——3D Rage Pro。3D Rage Pro的设计出色,可以提供45Mpixels/s(百万像素/秒)的填充率,VQ(Vector Quantization,矢量)纹理压缩和一个具有120万个多边形/秒的三角形生成引擎。它具有单周期的三线性过滤器和完整的纹理混合选项。遗憾的是,初期的驱动程序严重地限制了它的发挥,使它无法超过Voodoo芯片,也落后于1997年底问世的Riva128。1998年2月,ATI发布了Turbo驱动,承诺可以提升40%的速度,相应的芯片也改名为Rage Pro Turbo。1999年5月,Rage Pro的最终驱动发布,使用最终驱动后,3D Rage Pro游戏性能提高20%~40%。ATI起了个大早,却赶了一个晚集。
Rage 128 GL

1997年底,ATI收购了著名的2D图形制造厂商Tseng Labs的图形部门,其中包括40名工程师。加入ATI的Tseng的工程师队伍研发了Rage 128 GL。ATI在1998年底发布了这块芯片。在最初的计划中Rage128 GL被设计成Riva TNT和Voodoo2的竞争对手,它的内存加速器允许Rage128在最小的性能损失下运行在32bit真彩色,32MB显存和出色的DME支持AGP纹理。但不幸的是,当时多数游戏仍以16bit增强色运行,而这点正是Rage128GL的弱项,因为16bit抖动算法不佳,Rage128没能成为3D性能的霸主。而且由于要照顾苹果电脑的市场,PC版的Rage 128上市较晚,虽然它的2D输出极佳,DVD支持良好,但它的3D性能和TNT2相差甚远,而且驱动的优化仍是个大问题。
Riva 128

在经历了NV1、NV2的失败之后,NVIDIA又义无反顾地投入到NV3(Riva 128)的开发中。在沉寂了近两年后,NVIDIA终于爆发了,1997年底Riva 128发布,它具备了128bit的2D/3D加速的图形核心,填充率达到了100Mpixel/s,并拥有了第一个硬件三角形生成引擎,达到了500万个多边形/秒的生成速度,其理论性能已超过了3dfx的Voodoo图形芯片,当然也远远超过了ATI同代的产品。和Voodoo图形芯片相比,Riva 128在3D图形质量上仍有不小的差距,但低廉的价格和高性能的2D/3D加速使它成为OEM厂商的最爱。六个月后, NVIDIA发布了Riva 128的增强版本Riva 128ZX。这颗芯片所支持的帧缓冲从4MB增加到8MB,由于OpenGL在游戏中的逐渐普及,NVIDIA为它提供了完整的OpenGL ICD驱动。Riva 128一炮打响,取得了极大的成功。
SIS6326

1997年上半年SIS发布了SIS6326,它是同时支持PCI和AGP 1×接口的32位图形处理芯片,采用VLIW架构的浮点几何多边形生成器,每秒可以产生80万个几何多边形图案,并支持线性、双线性、三线性材质过滤。SIS6326最大的特点是内置了DVD硬解压功能,虽然它的3D性能并不出众,但凭借良好的兼容性、低廉的售价和优秀的DVD回放能力,SIS6326最终在低端市场赢得了不小的份额。
i740

1998年2月Intel推出了风光一时的i740 图形芯片。该芯片支持AGP 2×规格,像素填充率达到55Mpixels/s,支持DVD解压。不过借助Intel在芯片组领域的霸主地位及i740相对便宜的价格,i740取得了骄人的业绩。此后Intel干脆将i740芯片组整合到主板芯片组内以提高主板性价比。i740是Intel第一款独立的显示芯片,也是最后一款大规模发售的独立显示芯片。
Riva TNT

1998年3月Riva TNT发布,它的出现使NVIDIA真正站到了与3dfx比肩的高度。TNT的核心技术TwiN Texel引擎是一条双像素的32bit渲染流水线,允许在一个时钟周期内同时处理两个像素,使填充率达到250Mpixels/s。它最大支持16MB显存,在性能上已与Voodoo2旗鼓相当,并在32bit真彩显示下有更高的质量。Riva TNT的诞生让NVIDIA的实力得到了充分的展示。
G200

1998年5月Matrox的G200问世,G200是继G100之后的第二代3D图形芯片,它内置可编程的浮点生成和填充引擎,支持Direct3D和OpenGL,支持多纹理贴图和高精度的32位Z-Buffering。使用了一种被称为 VCQ(Vibrant Color Quality Rendering,鲜明色彩质量渲染)的技术,能够提供高质量的色彩输出,并且采用了新的SRA(Symmetric Rendering Architecture,对称渲染结构)技术,提高了2D加速和视频操作的性能。但是在3D性能上还远远不及RIVA TNT以及Voodoo2,而且价格高昂、不能良好支持OpenGL也是G200美中不足的地方。不过,借助其及优秀的2D画质,G200仍然赢得了不少平面绘图用户的青睐。
Savage3D

1998年5 月,2D时代叱咤风云的霸主S3经过苦心打造终于推出了第一块真正的3D加速卡——Savage3D,它采用128位总线结构及单周期三线性多重贴图技术,最大像素填充率达到125MPixels/s,三角形生成率也达到了每秒500万个。支持Direct3D与OpenGL,同时也支持当时流行的Alpha混合、多重纹理、边缘抗锯齿、16/24位Z-buffering、Tri-linear Filtering(三线性过滤技术)等技术,并首次采用了鼎鼎大名的S3TC智能纹理压缩技术,而且在播放MPEG-2时拥有极低的CPU占用率。在规格上它无疑是一款不错的产品,但它的驱动程序却存在不少Bug,再加上最多只支持8MB显存,最终Savage3D只能在低端市场独自徘徊。不过它也凭借不错的性价比赢得了“穷人的法拉利”称号。
Voodoo Banshee

Voodoo Banshee是3dfx再一次整合2D/3D引擎的尝试,它最高支持16MB显存,核心和显存频率分别为100MHz/125MHz,支持100MPixels/s的像素填充率和300万个/秒的三角形生成率,它的硬件性能超过了Voodoo2,但由于两条渲染流水线被减半,导致了它的3D性能降低不少。不过它内建的2D引擎在性能上基本上可与Matrox G200媲美,加上不错的超频能力,Banshee在市场上取得了不错的成绩,2D性能也获得了大众的首肯。
Voodoo3系列

1998年11月Voodoo3发布,在此之前,3dfx收购了STB,从此走上自主经营品牌显卡的路线,而不再只是一家芯片提供商,这种化友为敌自断后路的“愚蠢”举措使众多昔日盟友不得已加入NVIDIA阵营,3dfx王朝从此开始走向低谷。面对NVIDIA的凌厉进攻,在Riva TNT推出后半年,3dfx踌躇满志地发布了Voodoo3,梦想狂澜再起。但实际上Voodoo3与Voodoo2相比并没有本质上的不同,充其量不过是Voodoo 2和Banshee的结合体,最令人失望的是它只有16MB显存,而且不支持32位色彩渲染,在性能上落后于随后问世的TNT2。此外,不开放显卡授权,死抱着Glide图形接口不放也最终导致了阵营不断萎缩,3dfx开始没落。
Voodoo4/Voodoo5系列

1999年11月Voodoo 4 4500发布,它首次采用了3dfx独创的VSA架构(Voodoo Scalable Architecture,可升级Voodoo架构),支持多核心协同工作以大幅提高性能。并终于对32bit真彩渲染和2048×2048的大纹理提供了支持,但作为GeForce256的对手,它却不支持当时也非常热门的技术——硬件T&L(几何转换与光照),在总体3D性能上只能与TNT2持平。1999年11月,Voodoo5 5000发布,它采用两块VSA-100图形芯片,因此拥有两倍于Voodoo4 4500的填充速率和T-Buffer,但最大只能支持32MB显存制约了它的发展。
2000年5月,Voodoo 5 5500发布,此刻的Voodoo帝国已经摇摇欲坠,日薄西山。Voodoo 5 5500虽然拥有两颗VSA-100芯片,支持硬件级的全屏反锯齿,支持运动景深,但是高昂的价格、不完善的驱动、相对平平的性能,使很多人淡忘了这个末路英雄。最终3dfx在推出售价599美元、集成了四片VSA-100芯片的显卡Voodoo5 6000之后轰然坍塌,NVIDIA收购了3dfx所有的图形资产,包括芯片,知识产权和品牌。
AGP 2.0
关键词:
AGP 4×、1066MB/s、1.5V
代表产品:
Radeon256、Radeon8500、TNT2系列、GeForce256、GeForce 2系列、GeForce4 Ti系列等。
点评:
尽管工作频率没有改变,但AGP 2.0加入了AGP 4×模式,相应的数据带宽就达到了1066MB/s,因此数据传输能力大大增强了。
技术解读:
随着图形技术的飞速发展,显示芯片不断更新,尤其是GPU(Graphic Processing Unit,图形处理器)的出现,对带宽提出了更高的要求。GPU 其实就是高度集成和强化的显示芯片的称谓,它的出现代表了图形技术发展到了一个新的高峰。GPU能让显卡完成以往需要CPU才能实现的坐标转换和光影功能,也就是说,以往由系统内存传往CPU、并经CPU处理后传回系统主内存的数据,现在必须传到显卡上进行处理。而且当时的3D游戏场景也越来越庞大,这必然使当初的AGP 2×接口难以为继。于是1998年5月份,AGP 2.0 规范正式发布,它工作频率依然是66MHz,但工作电压降低到了1.5V,并且增加了4×模式,这样它在图形卡和系统北桥芯片之间提供了一条1066MB/s的数据通道,数据传输能力大大增强了。
除工作速度成倍增长外,AGP 4×还增加了Fast Write(快写)技术,它可让CPU直接把处理完的数据经过主板北桥芯片传送到GPU中去,而不必像以前那样必须经过系统内存这一缓慢的中介,避免了因系统内存带宽与显卡或系统前端总线带宽不匹配时,造成的数据等待情况,从而大大提升了显卡的处理速度。
为了配合AGP 4×的推广和普及,VIA(威盛)和Intel公司先后推出了各自经典的694×(即Apollo Pro 133A)和815系列芯片组。
经典回放:
Rage 128 Pro

ATI于1999年4月发布了Rage 128 Pro。和上一代产品相比,Rage 128 Pro加入了各向异性过滤支持、更强大三角形生成引擎和更高的时钟频率。同时ATI推出了“曙光女神”计划,即通过在一块显卡上集成多个相同的芯片来提供更高的性能。曙光女神存在致命的缺陷:它仅能在1600×1200的高分辨率下展现出实力。无法在低分辨率下发挥出优秀的性能,再加上成本较高,曙光女神的实施并不成功。
Radeon256

2000年4月ATI第六代图形芯片Radeon256公布,其规格之高在当时很难有产品望其项背,它支持DDR显存,并采用了节省带宽的Hyper-Z技术,支持完整的硬件T&L和凹凸贴图以及环境映射凹凸贴图,有两条渲染管线和提供单周期三纹理。在这款产品上ATI提出了“魅力引擎Charisma Engine”的概念。Radeon256算得上是ATI相当成功的一款产品。而且ATI随后把Radeon扩展到了廉价和移动市场,Radeon VE和Mobility Radeon就是从Radeon核心去除了T&L单元和一条像素管线,而且前者提供的基于Appian的HydraVision多屏显示技术,被公认为当时最出色的多屏显示解决方案。
Radeon8500

如果说DirectX 7.0时代的ATI是紧追NVIDIA,那么到了DirectX 8.1时代,ATI则通过Radeon 8500显卡首次超过了NVIDIA同期发布的GeForce 3。Radeon8500采用了0.15微米的制造工艺,核心/显存频率达到275MHz/550MHz,采用DDR显存,依靠改良的Hyper-Z Ⅱ技术,使显存带宽高达12GB/s!而它也是全球首款完整支持DirectX 8.1的图形芯片。还有Charisma Engine Ⅱ、Pixel Tapestry Ⅱ、Turform、SmoothVision等诸多的顶尖技术,使Radeon8500在规格上、性能上都成为市场的大热门,加上相对低廉的价格,Radeon8500一度成为市场的焦点。
TNT2系列

1999年3月在游戏开发者论坛(GDC)上,NVIDIA发布了两款新产品:TNT2标准版及廉价版本Vanta。TNT2标准版使用0.25微米的工艺制程,晶体管由800万猛增到1050万,从TNT到TNT2的晶体管集成度的提高已经超过了Pentium Ⅱ到Pentium Ⅲ的增长幅度。另外,TNT2已经开始使用最大为32MB的帧缓冲,同时TNT2也提供了对数字平板显示器的支持。并首次将产品线细分为TNT2、TNT2 M64、TNT2 Pro和TNT2 Vanta,涵盖了整个高、中、低市场。两个月后,更高频率的、填充率达到300Mpixels/s的TNT2 Ultra出货。TNT2在很多方面已经超越了同期的Voodoo3。再加上对32位色的支持,以及Direct3D和OpenGL的广泛使用,NVIDIA已经占据了上风。
GeForce256

1999年8月GeForce256问世,这是一款具有划时代意义的产品,它将GPU这个名词第一次带入图形领域,NVIDIA也第一次站到了3D图形王国的最高峰。这是一个核心频率为120MHz、拥有4条渲染流水线的芯片,理论上可以提供高达480Mpixels/s的像素填充率。同时GeForce256也是全球第一个集成几何加速/转换、动态光影、三角形设置/剪辑和四像素渲染等3D加速功能的图形引擎。硬件T&L技术将CPU从繁重的3D几何运算中解放出来,所有的变形与光照等原来由CPU处理的工作都交由GPU来运算。GeForce256开创了一个3D游戏的新时代。
GeForce2系列

2000年6月,NVIDIA开发出第五代3D图形加速卡——GeForce 2,它采用了0.18微米制造工艺,不仅大大降低了发热量,而且工作频率提高到200MHz。GeForce 2拥有四条图形纹理通道,单周期每条通道可以处理两个像素纹理,并且使用DDR解决显存带宽不足的问题。GeForce2还拥有NSR(NVIDIA Shading Rasterizer)技术,同时支持S3TC(S3纹理压缩)、FSAA(全屏抗锯齿)及硬件MPEG-2动态补偿功能等,完全支持微软的DirectX 7。针对不同的市场,NVIDIA相继推出了定位于低端的GeForce2 MX系列和面向高端市场的GeForce2 Pro和GeForce2 GTS。GeForce 2系列是当时当之无愧的显卡之王。
GeForce3系列

进入2001年以后,显卡市场演变为NVIDIA与ATI两雄争霸的局势。NVIDIA在2001年2月推出GeForce 3系列。GeForce 3显卡最主要的改进之处就是增加了可编程T&L功能,能够对几乎所有的画面效果提供硬件支持。GeForce 3共有4条像素管线,填充率最高可达800Mpixels/s。GeForce 3系列还拥有nfiniteFX顶点处理器、nfiniteFX像素处理器以及Quincunx抗锯齿系统等技术。
GeForce4 MX系列

2002年2月,NVIDIA同时推出了GeForce4 MX系列和GeForce4 Ti系列,分别面向中高端市场。作为GeForce2 MX的后继者,GeForce4MX系列的核心也采用了NV11(而非GeForce4 Ti的 NV25)。与GeForce2 MX相比,它最主要的改进是拥有较高的频率和LMA Ⅱ(LightSpeed Memory Architecture Ⅱ,光速交错式显存架构Ⅱ),显著增加了可利用的内存带宽,从而使性能获得较大的提升,不错的性能和正确的市场定位使 GeForce4 MX一度成为市场上存活期很长的一款产品。
GeForce4 Ti系列

GeForce4 Ti系列图形芯片沿用了GeForce3的架构,同时也做了相当大的改进,拥有nfiniteFXⅡ引擎,并配备了两个并行的高频率的Vertex Shader引擎,Pixel Shader引擎的版本也升级到了1.3。相同时间可处理三倍于GeForce3 Ti的顶点数据。采用新的Accuview AA技术,再配合LMA Ⅱ,可以大幅改善FSAA的性能。一系列新技术的采用最终铸就了GeForce4 Ti系列历久不衰的经典显卡,后来也衍生出了AGP 8×版本。
S3 Savage 2000

在Savage 3D之后,S3发布了Savage 4,但由于其3D性能表现平平,产品的占有率也接连下降。1999年7月S3再次推出“野人”显卡——Savage2000。Savage2000采用了全新的设计架构,采用0.18微米制造工艺和主流128位显存控制器设计,引入了双重像素/双材质管道技术(该技术使Savage2000每秒可处理两个多重纹理像素),3D性能较前代而言有相当大的提升。由于整体性能不敌GeForce256,加上糟糕的驱动程序,Savage2000没能为S3扭转败局,S3的辉煌终于成为了历史,它不久便被VIA收购,又一个显卡巨人倒下了。
Matrox G400

1999年3月G400发布,在这款产品中,Matrox进一步加强了自己在2D方面的优势。同时在3D方面也有了突破,环境映射的效果让人印象深刻。高分辨率下的低CPU占有率使它在播放DVD时更具优势。G400最大卖点就是2D图形质量、3D环境映射、凹凸贴图和双头显示技术,但其高昂的价格让普通用户望而却步。
小知识:AGP Pro
由于图形芯片处理能力的提高,芯片中集成的晶体管数量也急剧增多,这导致显卡(尤其是专业显卡)对电能要求的增加,这时必须对整个AGP结构进行重新设计,于是AGP Pro应运而生。
AGP Pro是一种为了满足显卡功耗日益增大而研发的图形接口标准,它可以驱动功耗更大(25W~110W)或处理能力更强大的AGP显卡。它完全兼容AGP 4×规范,AGP 4×显卡可以插在AGP Pro插槽中使用(但AGP Pro显卡却不能插入普通AGP插槽中)。AGP Pro插槽在原有AGP插槽的两侧进行扩展,并要求邻近AGP插槽的两条PCI插槽归它使用。在外形上,AGP Pro插槽比AGP插槽前后都长出一截,这主要是利用延伸插槽中的引脚提供额外的电压,供给显卡使用,当然它们还能利用邻近的PCI插槽获取额外的电压。
由于AGP Pro是为专业显卡设计的,所以我们很难在家用主板上见到它的身影,只有少数厂商在自己的某些高档台式机主板上使用了AGP Pro插槽。
AGP 3.0
关键词:
AGP 8×、2.1GB/s、0.8V
代表产品:
Xabre系列、Radeon 9700 Pro/9800 Pro、Radeon 9550、GeForce FX5200等。
点评:
AGP 3.0增加了8×工作模式,它的数据传输能力达到了AGP 4×的2倍。
技术解读:
在商业利益的推动下,图形技术的发展速度很难预料的。很快,具备8条像素流水线、并配备了多组像素渲染管线和顶点渲染器的顶尖显卡(如ATI Radeon 9700 Pro或NVIDIA GeForceFX)面市了,它们都需要从系统主内存中读取生成3D场景所必需的顶点数据,并迅速地进行场景生成和着色处理。对于这些显卡,想把纹理放入系统主内存进行处理的想法是不现实的。因为当时显存的带宽通常达到或超过8GB/s,最高甚至达到了19.2GB/s,因此一旦纹理或顶点数据需要从系统内存读取时,GPU就会空转或等待,从而从整体上拖慢整个显示系统的速度。2000年8月,Intel推出AGP 3.0规范,工作电压降到0.8V,并增加了8×模式,这样它的数据传输带宽就达到了2133MB/s,数据传输能力相对于AGP 4×成倍增长,Intel期望它能满足显示设备日益增长的带宽需求。
除带宽提升外,AGP 3.0相比AGP 2.0还有其他一些改进。例如“多AGP端口”技术,该技术允许主板(即北桥芯片)支持多块AGP显卡。换句话说,主板在理论上具有实现AGP 8× SLI的基础。遗憾的是,由于商业方面的因素和PCI Express总线的提前出现,“多AGP端口”技术并没有得到实际应用。此外,支持同步处理和Fast Write模式下的流控制也是AGP 3.0的重要特性,它能自动地控制AGP设备→主板北桥芯片→处理器这3个部件同步工作,当处理器把处理完的数据写进系统主内存时,北桥芯片会把其中部分数据放入缓存中,而AGP设备此时并不需要等待,它会预先设置好缓存空间和区域,当CPU准备把处理完的数据向AGP设备写入时,AGP设备就可迅速从缓存中提取资料。不过,并不是每一款AGP 8×芯片组或图形核心都支持此功能,只有显卡和主板芯片组都支持此模式,系统才能获得相应的性能提升。
尽管AGP 8×早在2000年8月就已问世,但当时并没有引起普通用户太多的注意,直到两年后SIS648、P4X400、KT400、nForce2等支持AGP 8×的芯片组相继问世,AGP 8×标准才慢慢普及开来。

经典回放:
Xabre

Xabre
2002年4月SIS的Xabre系列推出,这一系列产品使用了独创的Frictionless Memory Control(FMC)显存架构,采用“块式减免隐面无效渲染算法”技术,可以有效提高图形芯片的渲染速度,减少渲染时带宽的占用率,同时Xabre系列显卡(Xabre80除外)也是第一款同时支持AGP 8×和DirectX 8.1的显卡。
幻日 Parhelia-512

2002年5月Matrox的幻日 Parhelia-512面世,它是首个支持DirectX 9、512bit的3D图形芯片。Parhelia-512采用了FAA(Fragment Antialiasing)技术,在只占用了少量带宽和芯片运算能力的情况下,提供了一流的反锯齿效果,保证了画面锐利清晰。不过,Parhelia-512因为实际3D性能比NVIDIA和ATI主流产品相差较大而惨遭冷落。从此Matrox也远离了桌面市场。
Radeon 9700 Pro

2002年7月ATI Radeon 9700 Pro推出,它提供了对DirectX 9和AGP 8×的完全支持,是当时业界最先进的硬件设计,ATI用“VPU”(即视觉处理单元)的称谓来对抗NVIDIA的“GPU”,Radeon 9700 Pro采用0.15微米工艺制造,内部拥有8条渲染管道,256bit四通道交叉执行的显存架构,全新的顶点处理引擎、渲染引擎、Hyper-Z Ⅲ处理技术等。凭借新的Multisampling算法,Radeon9700的3D性能获得了有效的提升,并一举登上性能之王的宝座。在这之后,ATI推出的Radeon 9500 系列也大受欢迎,掀起了一股改造狂潮。由于Radeon 9700 Pro的巨大成功,ATI在原有架构基础上又发布了Radeon 9800 Pro,并再一次获得了速度之王的桂冠。
Radeon 9550

2004年ATI大放异彩,最大的功臣当数面向中低端的Radeon 9550。这款2004年最具性价比的显卡,使ATI在低端市场呼风唤雨。Radeon 9550依然基于RV350制造,在支持特效方面也完全与该系列最高端的Radeon 9600 XT相同。它采用0.13微米制造工艺,核心频率为250MHz,显存频率为400MHz,4条渲染管道,1个纹理单元,同时兼容64bit和128bit。Radeon 9550发布之时ATI并没有对它所搭配的显存作太多限制,同时RV350核心出色的超频能力更赋予了Radeon 9550强大的生命力。优秀的性价比使它成为ATI低端显卡中销量最大的型号!
GeForce FX5800/5900/5200

2002年11月GeForce FX5800面市,它也实现了对DirectX 9的Pixel Shader 2.0、Vertex Shader 2.0等技术特性的完整支持,配备一个并行Vertex Shader(顶点着色引擎),三角形生成速率达到了3.75亿个/s,具有128位CineFX引擎。但与Radeon9700相比,GeForce FX5800 128bit的显存位宽制约了其性能的发挥,而且由于成本高昂,无法大量销售。不过在2003年,NVIDIA推出了GeForce FX5900系列,改进了工艺,提高了性能,降低了成本,成为一款不错的产品。
GeForce FX5200(即NV34)是NVIDIA针对低端市场开发的DirectX 9产品,以取代GeForce4 MX。GeForce FX5200也是从高端核心简化而来,流水线中的像素渲染管线减至4条。由于顶点渲染效率较低,FX5200在DirectX 9下的速度并不理想。但NVIDIA有效地降低了它的生产成本,再加上NVIDIA市场影响力,FX5200仍在低端显卡中取得了很大的成功。
从2005年下半年开始,PCI-E平台已逐渐进入主流,显卡也开始纷纷采用PCI-E接口,NVIDIA逐步推出GeForce 6200、6600、6800、7800系列, ATI也接连发布X300、X700、X800、X1000系列。尽管采用这些新芯片的显卡中有不少桥接的AGP产品,但AGP被PCI-E接口代替是不可避免的历史趋势,至于PCI-E显卡,那将是另外一段传奇故事了。
AGP显卡的兼容性问题
由于AGP规范前后历经10年总共3代的发展,再加上由于兼容性和商业策略的原因,导致当前的AGP主板插槽和AGP显卡有着多种物理设计。而在实际使用中,用户经常会遇到新显卡配旧主板或新主板配旧显卡的情况。这时一定要注意主板的AGP插槽和显卡的AGP接口是否兼容,比较常见的AGP模式兼容性问题有:Voodoo3和TNT这类纯AGP 2×显卡无法用在i845级别以上的主板上;早期AGP 4×显卡(如GeForce256、MatroxG400、Savage4等)不完全支持AGP 4×的两种工作电压(3.3V和1.5V),这种显卡插入AGP 4×/8×插槽中时,轻则造成电脑无显示,重则烧毁显卡或主板。下面我们总结一下曾经出现过的主板AGP插槽和AGP显卡接口。
主板插槽
1.AGP 3.3V插槽:它的特征是插槽靠近I/O挡板一端有一个隔断。在 AGP 1.0时代,所有主板都使用这种插槽,它支持AGP 1×/2×显卡,电压3.3V。如经典的Intel 440BX芯片组和威盛的693A芯片组主板。

2.通用AGP插槽:它是在 AGP 2.0标准提出后出现的,这种插槽没有隔断,保证了可以插入所有的显卡,支持1.5V/3.3V电压,支持AGP 1×/2×/4×。第一代的AGP 4×芯片的主板,如694X、KT133A和i815等芯片组主板都采用了这种插槽。

3.AGP 1.5V插槽:它支持AGP 1×/2×/4×,但按照AGP 2.0标准它仅仅支持1.5V电压。从物理特征上讲它也有一个隔断,但和“AGP 3.3V主板插槽”不同的是,它的隔断位于远离I/O挡板的一侧。850/845主板使用了这种插槽。

4.通用1.5V AGP 3.0插槽:它做到了兼容AGP 2.0和AGP 3.0标准,第一批支持AGP 8×的SiS648、KT400、865/875等芯片组主板采用的都是这种插槽。当前主板上使用的也几乎都是这种插槽,它的外观特征和“AGP 1.5V插槽”外观一致。
显卡接口
1.AGP 3.3V显卡接口:对应AGP 3.3V主板插槽,早期的显卡都是使用这种接口的。比如Riva 128显卡、Voodoo 3以及i740显卡都只支持3.3V电压,所以它们也只能插在支持3.3V电压的AGP插槽中,它的金手指在靠近I/O挡板的一侧有一个缺口。

2.通用AGP显卡接口:这是AGP 4×时代显卡的常见接口,经典G400 MAX、TNT2、Savage 4等显卡都使用了这种接口,它的物理特征就是在金手指中有两个缺口。它们可以插入任何AGP插槽中。

3.通用1.5V AGP 3.0显卡接口:这种接口同时支持1.5V和0.8V电压,它的金手指在远离I/O挡板的一侧有一个缺口。ATI的Radeon 9800XT显卡使用这种接口。

4.通用AGP 3.0显卡接口:这种接口外观和“通用AGP显卡接口”一样,有两个缺口,但它增加了对AGP 3.0的支持。ATI Radeon 9200之后的显卡及NVIDIA GeForce MX440-8X和Ti4200-8X之后的许多显卡都采用了这种接口。
要注意的问题
1.在AGP 3.3V主板插槽上使用通用AGP 3.0显卡的问题,这其实就是在BX级的老主板上使用Directx8或Directx9新显卡的问题,在理论上这样使用没有问题,但在实际使用中往往会遇到这样那样的问题,而可能无法正常使用,所以这种组合我们并不推荐。
2.部分AGP2.0显卡的问题,它们虽然有两个缺口可以插入AGP 1.5V主板插槽和通用1.5V AGP3.0主板插槽,但由于使用的是3.3V电压,会造成主板北桥烧毁,所以有人称这些显卡是伪AGP 2.0显卡,使用时一定要多加注意。
AGP大事记
▲1996年7月,APG 1.0规范发布。
▲1997年2月,第一款AGP 主板芯片组 440LX 问世。
▲1997年4月,第一款AGP 1×显卡芯片 ATI 3D Rage Pro问世。
▲1997年10月,第一款AGP 2×显卡芯片Intel i740 问世。
▲1998年2月,经典的AGP主板芯片组Intel 440BX 问世。
▲1998年5月,AGP 2.0 规范正式发布。
▲1998年7月,威盛的694×芯片组抢先于Intel的815问世,成为第一款支持AGP 4×的主板芯片组。
▲1999年3月,第一款AGP 4×显卡芯片 NVIDIA Riva TNT2 问世。
▲2002年9月,AGP 3.0 规范正式出台。
▲2002年10月,第一款AGP 8×主板芯片组SIS648诞生。
▲2002年11月,第一款AGP 8×显卡 SIS Xaber 400问世。
英雄迟暮——PCI Express取代AGP
由于技术的进步,当前显示芯片已经担负了以往必须由CPU完成的三角形生成和场景设置的运算。但减免CPU工作的同时,却也增加了AGP通路的负担,顶点数据需要由AGP输入显示芯片进行运算,AGP 8×对于缓解其负担是有好处的。但AGP 8×对于日益精美的3D游戏来说仍然是不够用的,AGP 规范的最高速度是8×,可以提供2.1GB/s的带宽。我们知道AGP 8×起初的想法是提高从系统主内存中读取顶点数据和纹理的带宽和速度,但实际上对于画质日趋精美的3D游戏来说,AGP 8×那点可怜的带宽远远无法满足纹理数据读取的需要,现今主流显卡的显存带宽都达到了10GB/s以上,显存容量也都在64MB以上,所以游戏开发商仍然采用了从显存中读取纹理数据的方式,不是说他们不想利用系统主内存,而是和显存相比,主内存仍然太慢。不过,虽然AGP 8×显卡在各种测试中对速度提升有帮助,但并没有产生质的变化,总线接口呼唤新的变革!
AGP 8×成为了AGP规格中生命周期最短、也是最后的一种标准。在2001年的春季IDF大会上,英特尔公司提出3GIO(Third Generation I/O Architecture,第三代I/O体系)总线的概念,它以串行、高频率运作的方式获得高性能,它将被设计为满足未来十年PC系统的性能需要。2002年4月3GIO正式更名为PCI Express。抛开性能惊人不说,PCI Express改良了基础架构,彻底抛离落后的共享结构,一个新的时代开始了。
在工作原理方面,PCI Express与并行体系的PCI没有任何相似之处,它采用串行方式传输数据,而依靠高频率来获得高性能,因此PCI Express也一度被人称为“串行PCI”。由于串行传输不存在信号干扰,总线频率提升不受阻碍,PCI Express很顺利就达到2.5GHz的超高工作频率。其次,PCI Express采用全双工运作模式,最基本的PCI Express拥有4根传输线路,其中两根用于数据发送,另两根用于数据接收,发送数据和接收数据可以同时进行。同时PCI Express使用8b/10b编码的内嵌时钟技术,时钟信息被直接写入数据流中,这比PCI总线能更有效节省传输通道,提高传输效率。第三,PCI Express没有沿用传统的共享式结构,它采用点对点工作模式(Peer to Peer,也被简称为P2P),每个PCI Express设备都有自己的专用连接,这样就无须向整条总线申请带宽,避免多个设备争抢带宽的糟糕情形发生,而此种情况在共享架构的PCI系统中司空见惯。
由于工作频率高达2.5GHz,最基本的PCI Express总线可提供的单向带宽便达到250MB/s。如果是全双工运作,PCI Express ×1的总带宽达到500MB/s。PCI Express ×4、×8和×16模式的有效数据传输速率分别达到2GB/s、4GB/s和8GB/s。这与PCI总线“可怜”的共享式133MB/s速率形成鲜明的对比,更何况这些都还是每个PCI Express可独占的带宽。高性能、高扩展性、高可靠性及出色的兼容性注定了PCI Express的压倒性胜利。
漫漫十年AGP发展之路,让我们经历见证了3D技术的飞速发展,也感受到了技术带来的多彩体验。在下一个十年中我们又将迎来新一轮的技术浪潮。
AGP显卡升级指南
不可否认的事实已经残酷地摆在了升级用户的面前,现在的显卡市场已经进入到了PCI-E时代。即使你不想升级CPU和主板,市场上也没有太多的AGP显卡供你选择。不过很多事情也是会有转机出现的,因为有了桥接芯片,依然会有非原生AGP显卡在出售。虽然这些显卡的数量并不多,却是显卡升级的最好选择。
升级策略分析
升级眼光高一点
既然舍不得放弃自己原有的CPU和主板,那么就踏踏实实地把升级目标锁定为AGP显卡。只是需要特别注意的是,升级显卡时的眼光应该更高一些,尽量不要选择入门级的显卡产品。否则用不了多久,就会再次面对升级问题。经典的Radeon 9550就不要考虑了,毕竟这款显卡的年代过于久远,即使运行游戏时的速度并不太慢,特效技术方面的劣势也是显而易见的。毕竟大多数升级用户都是为了玩游戏而升级,小幅度的升级虽然节省资金,但实际意义并不大。同样的问题也适用于GeForce 6200A显卡,这款入门级的显卡只具备64bit显存位宽,性能上受到严重影响,升级用户应该考虑更高级别的显卡产品,把眼光放得更远一点。
升级预算别太多
就目前的市场行情来看,千元以上仍旧属于高端范畴。这些高端显卡虽然拥有优秀的性能,却需要花费更多的金钱。况且这些显卡性能的提升并不与价格成正比,在运行大多数游戏时,千元以上的显卡并不能带来质的飞跃(主要受到CPU和主板的性能制约)。对于升级用户来说,千元以下的AGP显卡才算是最好的选择。毕竟PCI-E显卡已经成为了市场上的绝对主流,PCI-E显卡同时也呈现出了比AGP显卡更为优秀的性价比。如果升级用户舍得花费1000多元来升级显卡,还不如再添加500元把整个平台都换掉。这样一来,整机的游戏性能会得到更大的提升,很长时间内也不会面临升级问题。
哪些平台适合升级AGP显卡
虽然升级CPU和主板的花费很多,但并不是所有的平台都满足节省花费的需求,有时仅仅升级AGP显卡并不能带来多大的性能提升。最应该进行彻底升级的当然就是PⅢ平台和Athlon平台,这些平台已经太过于古老了,CPU已经成为了整个系统的性能瓶颈,必须进行整个平台的完全升级。
至于P4平台和Athlon XP平台,则主要根据芯片组来决定。Intel平台中的845系列芯片组(845D、845E、845PE)由于只支持AGP 4×,所以并不能把显卡的性能完全发挥出来。并且845系列芯片组通常搭配缓存容量只有128KB的Celeron处理器,性能上并不太好。如果资金允许的话,还是进行整个平台的升级。AMD平台中的KT266(A)和KT333(A)系列芯片组也算是比较过时,单独升级AGP显卡的意义并不大,最好升级整个平台。
这样一来,适合升级AGP显卡的平台就不多了。Intel阵营中,主要以865PE和848P芯片组为主。这两款芯片组可谓是老当益壮,不但搭配了性能不差的Celeron D或P4处理器,而且还可以支持AGP 8×显卡。AMD阵营中,主要以KT400、KT600、NF2、K8T800、NF3系列芯片组为主。前面的三款芯片组虽然还属于K7时代,不过由于Athlon XP的性能还是相当不错的,所以升级AGP显卡也可以完全发挥出显卡性能。后面的两款芯片组是属于K8时代,升级AGP显卡就更没有问题了。
不过需要特别注意的是,市场上还曾经出现过带有AGP插槽的865GV和845GV主板。实际上,这个显卡插槽是从南桥芯片引出的,属于PCI总线,显卡性能会受到很大影响,并且还存在兼容问题。所以采用这两款主板的用户,还是升级整个平台为好。
升级主力军:桥接AGP显卡
虽然原生PCI-E显卡占据了市场上的绝对主流,显卡厂商却仍然给AGP显卡市场留有一定的生存空间,升级用户也因此有了更多的选择。占据市场最大份额的GeForce 6600系列通过桥接芯片摇身一变就成为了AGP显卡,虽然进行了接口变换,但桥接芯片所带来的性能影响却是微乎其微的,升级用户自然就可以放心购买。通常情况下,AGP版本要比PCI-E版本贵50元~100元,这部分金额是由于桥接芯片所带来的成本增加,对于大多数升级用户来说,这点钱比起升级主板和CPU的花费可要便宜许多。
最佳选择:GeForce 6600系列
虽然GeForce7系列显卡已经上市,不过GeForce 6600系列仍旧是升级用户的最好选择。最主要的原因当然是前者的AGP版本还没有正式发布,更何况GeForce 6600系列仍然是老当益壮。除了已经停产缺货很长时间的GeForce 6600LE以外,GeForce 6600系列显卡都有8条渲染管线和3个顶点着色器,并且还可以支持SM3.0技术,应对主流游戏的性能还算不错,基本可以满足升级用户的需求。
AGP版本的GeForce 6600系列显卡共分为三大类,都采用桥接芯片实现AGP接口。第一类是标准版的GeForce 6600显卡,搭配普通的DDR显存颗粒,超频性能一般,售价在699元~799元之间;第二类是超频版的GeForce 6600显卡,采用了GDDR3显存颗粒,超频性能极强,售价在899元~1099元之间;第三类是GeForce 6600GT显卡,不但核心频率较高,并且还搭配了GDDR3显存颗粒,无须超频性能同样优秀,售价在999元~1099元之间。当然需要特别说明的是,第二类与第三类显卡之间的价格差距并不是很大,所以推荐购买第一类或第三类显卡。
产品推荐:
微星NX6600GT-TD128

微星NX6600GT-TD128采用了GeForce 6600GT显示核心,核心频率为500MHz,显存频率为800MHz,采用mBGA封装的2ns GDDR3显存颗粒,构成了128MB/128bit的显存规格,并采用了VGA+DVI+TV-OUT全接口设计。该款显卡在供电滤波电路中元件的选用非常考究,采用了大量日系三洋固态电容和供电模块。优秀的用料保证了显卡超频后的稳定性。超大型的散热风扇和纯铜的散热片,使它具有相当优秀的散热效果。树叶状散热片正好完全覆盖住显示核心和显存颗粒,纯铜的材质加快了热量的传递。
技嘉GV-N66128DP AGP

技嘉GV-N66128DP AGP采用了GeForce 6600显示核心,核心频率为400MHz,显存频率为500MHz,采用了TSOP封装的4ns DDR显存颗粒,构成了128MB/128bit的显存规格,采用了VGA+DVI+TV-OUT全接口设计。供电部分用料相当不错,清一色的日系电容,从稳定性和使用寿命方面来看,会有非常不错的表现。散热器部分采用了分体的散热设计,考虑到核心部分的发热量较高,所以散热片选用了纯铜材质。桥接部分则以铝合金材质为主,通过有效增加控制面积,来散发显卡工作时发出的热量。
●新生力量:Radeon X1000系列

Radeon X1000系列是ATI的新生力量,支持SM3.0技术。面向千元以下显卡市场的主要是Radeon X1600系列和Radeon X1300系列,前者具备了12条渲染管线和5个顶点着色器,性能相当于GeForce 6600GT显卡。后者具备了4条渲染管线和2个顶点着色器,性能接近于GeForce 6600显卡。目前只有蓝宝石这个品牌推出了AGP版本的Radeon X1600Pro和Radeon X1300显卡,都是通过桥接芯片来实现AGP接口的。
产品推荐:
蓝宝石X1600Pro AGP版
蓝宝石X1600Pro AGP版采用了Radeon X1600Pro显示核心,核心频率为500MHz,显存频率为800MHz,采用了mBGA封装的2.5ns DDR2显存颗粒,组成了256MB/128bit主流的显存规格,显卡输出接口为标准的VGA+DVI+TV-OUT组合。显卡的散热器设计也不惜成本,采用了纯铜底座,风道设计十分科学,配合高转速风扇,散热效果十分到位。
升级预备役:原生AGP显卡
虽然市场上的原生AGP显卡越来越少,不过GeForce 6800显卡仍旧是老而弥坚。GeForce 6800显卡共有12条渲染管线和5个顶点着色器,不但完全支持微软DirectX 9.0c和SM 3.0技术,还拥有256bit的显存位宽。并且GeForce 6800系列本来就是原生AGP显卡(后来才出现了原生PCI-E版本)。最近一段时间,特价的GeForce 6800显卡已经降到了999元,性价比十分高。另外需要特别说明的是,市场上还存在着GeForce 6800显卡的派生产品,那就是GeForce 6800 LE/XT/GS这三种显卡。不过这三种显卡要么在规格上缩水严重,要么在价格上定位过高。总之都不太适合升级用户,还是标准版的GeForce 6800更为超值。
产品推荐:
捷波魔力6800-128MB超强版
捷波魔力6800-128MB超强版采用了GeForce 6800显示核心,核心频率为350MHz,显存频率为700MHz,采用mBGA封装的2.2ns DDR显存颗粒,拥有128MB的显存容量和256bit的显存位宽,采用了VGA+DVI+TV-OUT全接口设计。该款显卡采用了散热效能更为强悍的GeForce 6800GT公版散热器,显存部分也采用了大面积的散热器,可以同时为核心和显存进行散热,良好的散热性能保证了显卡的正常工作环境。
