新架构的融合之战——AMD Llano APU全面解析与深入测试
主题策划
当Intel在年初发布Sandy Bridge平台处理器时,其CPU整合的核芯显卡表现出了让很多用户惊喜的3D性能,那个时候许多AMD的Fans都在望眼欲穿地等待AMD的APU上市与Sandy Bridge平台展开正面交锋。不过,AMD在今年1月只发布了一款名为Brazos E350的入门级APU,一众AMD的Fans等待了差不多半年之后,AMD终于发布了面向主流市场的Llano APU产品——A6和A8系列,并同时发布了基于Llano APU的“Lynx”平台。
那么,新一代的AMD处理器,融合了CPU和GPU,采用新架构设计和32nm制程的A6和A8系列处理器是否能带给我们惊喜呢?AMD的融合之路是否能够为AMD开辟一片新的天地?今天,我们就一起来看一看。

Llano APU规格全解析

Llano APU定位于主流台式机市场,高于入门市场的Brazos E系列APU。首先发布的APU型号有4款,分别是针对高端的A8 3850、A8 3800和针对中端的A6 3650、A6 3600,之后还会有A4和其他产品陆续发布,A6和A8为四核心APU产品,A4为双核心APU产品。
虽然Llano APU的Core架构是K10的延展,但却有不小的改进,Llano APU保留了128KB一级缓存,为每颗核心设计了1MB二级缓存,不过并未保留三级缓存。好在Llano APU基于IP(Instruction Pointer,指令指示器)的HW Prefetcher(硬件预读器)设计被重新改进、Reorder缓冲器容量提高了20%、Load/Store单元的缓冲器容量翻倍,更增加了硬件除法器 (Hardware Divider),这些改变让Llano APU的每时钟周期指令数(Instructions Per Clock)比当前的处理器高出了6%,消除了取消三级缓存带来的性能影响。
由于采用了新架构,核心中加入了GPU,因此Llano APU不再兼容原来的Socket AM2+、AM3接口,而改为使用拥有905针的Socket FM1接口。要想使用Llano APU,消费者必须购买支持Llano APU的A75或A55系列主板,同时A75或A55系列主板也无法兼容以前的Socket AM2+、AM3接口处理器。不过AMD厚道地采用了和以前AM2+、AM3接口兼容的散热器扣具,原来的散热器可以方便地用于Llano APU的散热。


融合,CPU+GPU
通过努力,AMD将CPU和GPU集成在了同一块硅芯片上,北桥控制器、X86 CPU和显示核心,融合到了一起,在32nm制程下,APU集成度大幅提升,功耗却有了一定的降低。APU利用高带宽的内部总线通讯,集成高性能的内存控制器,将CPU和GPU之间的互连接口进一步增强,并且统一进行双向电源管理,GPU也支持高级编程语言,实现了统一的CPU/GPU寻址空间、GPU使用可分页系统内存、GPU硬件可调度、CPU/GPU/APU内存协同一致,以达到统一调度的目的。

独显核心很给力
Llano APU内部融合的GPU基于HD6500(A4 3400 APU的GPU基于HD6410)系列, AMD宣称Llano APU里融合了一颗独显级别的显示核心,AMD称为独显核心。从Llano APU结构示意图中我们可以看出,Llano APU中有几乎一半的空间是被独显核心所占据。其独显核心最大的优势是提供了DirectX 11的支持。从SP单元来看,Llano APU最高端的A8系列APU内部的独显核心拥有400个SP单元、20个纹理单元和8个ROP光栅单元,而AMD的中低端独立显卡Radeon HD6570也不过拥有480个SP单元、24个纹理单元和8个ROP光栅单元,两相比较就能看出Llano APU整合的独显核心性能应当很不错。不过,HD6550D采用的存储控制器不如Radeon HD6570,其显存也是共享系统的DDR3,性能自然要比GDDR5要差一些。
借助于独显核心不错的图形性能,Llano APU不仅可以支持DX11游戏,还支持HD3D功能、视频稳定技术、Graphics Anisotropic Filltering技术、OPCL、DirectCompute双通用计算模式等,显示出了出色的显卡性能。当然,不得不提的还有Radeon HD6000系列显卡整合的UVD3高清硬件解码单元, 它让Llano APU能够表现出出色的高清硬件解码能力,大幅度降低在高清视频播放过程中的CPU占用率。
实测辨性能
我们根据AMD Llano APU的定位、售价以及其中整合的独显核心的规格,组合两套配置进行测试,同时为了详细说明其性能与市场上APU的对手的差距,给出两套同样整合显示核心的平台,然后通过对整机性能和游戏性能的测试来验证Llano APU的性能表现,同时加入混合交火的性能测试和高清视频播放测试,以期最全面地描述Lynx平台APU系统的整体性能。在性能测试中,我们将测试分为整机及游戏性能测试、处理器性能测试、USB 3.0读写性能测试三个方面。
在整机性能的测试环节,我们引入最新的PCMark7进行测试,PCMark 7包含七个不同的测试环节,结合超过25个独立工作负载,涵盖了存储、计算、图像与视频处理、网络浏览、游戏等PC日常应用的方方面面。在游戏性能测试上,我们使用3DMark11、3DMark Vantage以及主流的DX9/DX10/DX11游戏来考查各配置的游戏性能,包括《街头霸王4》、《生化危机5》、《正当防卫2》、《失落的星球2》以及《天堂2.5》。由于对比测试的4套配置均采用整合显卡(核芯显卡、独显核心),3D性能不可能非常出色,因此在测试用的游戏环境我们都统一设置为1280×720的分辨率,所有测试环节中均使用中画质特效,所有游戏测试均关闭AA和AF。
在处理器性能测试环节,我们通过运行Cinbench R11.5 64Bit、wPrime、WinRAR4.0 64Bit等测试程序来测试其得分,同时用TMPGEnc XPress 4.7.6.304压缩一段62分29秒的视频来测试其编码能力,最后用OCCT对CPU进行压力测试,看看在CPU满载的情况下系统的功耗是多少。
在USB 3.0性能测试环节,我们使用读写性能都非常出色的宇瞻AH552 USB 3.0闪存作为USB 3.0测试设备,通过HD Tune Pro 4.61测试其读取性能,同时利用Fastcopy 2.0来进行5000个5KB文件的读写和一个3401.6MB大文件的读写测试,计算其读写时间,以测试Lynx平台A75芯片组原生支持USB 3.0的性能。





测试平台配置
■处理器:Intel Core i5 2500K;AMD Phenom II X4 955;AMD A6 3650;AMD A8 3850;
■主板:技嘉Z68A-D3H-B3;映泰TA880GU3+;华硕F1A75-V PRO
■内存:宇瞻DDR3 1600 2GB×2
■硬盘:希捷7200.12 1TB
■显示器:DELL U2410
■电源:金河田Aresze EPS450ELA
■系统:Windows 7 64bit中文版
整机及游戏性能测试分析
PCMark7的测试成绩在我们的意料之中,毕竟Intel平台的PCMark7表现一向很突出,综合性能表现,Core i5 2500K拥有明显的优势,其他测试子项,创作性能和计算性能方面Core i5 2500K平台也拥有绝对的优势。不过,Llano APU的表现也相当出色,可以看到即便是售价在760元左右的A6 3650 APU的平台性能也能够超过售价在860元左右的PhenomⅡ X4 955的平台性能,更不用说售价在880元左右的A8 3850APU平台的表现了。
当然,各测试平台的PCMark7测试成绩并不是最重要的,从Llano APU整合的独显核心来说,我们更关心的是Llano APU平台的3D游戏性能。Llano APU在3D游戏性能测试中有非常不错的表现。从3DMark Vantage测试结果可以看到,无论是A8 3850还是A6 3650的3D游戏性能都非常突出,APU的游戏性能有了非常明显的提升,Llano APU的3DMark Vantage成绩超过PhenomⅡ X4 955搭配的880G主板整合显卡10倍左右,虽然880G主板整合的Radeon HD4250是非常老的显示核心,但毕竟还是现在市场上主流销售的主板,这种性能的提升让人惊叹。即便是和Core i5 2500K的核芯显卡HD300相比,A8 3850和A6 3650的独显核心领先的幅度也分别有126%和68%。而支持DX11游戏特效更是Llano APU独有的优势,虽然3DMark11的成绩分别只有E1805和E1225,但也算是莫大的成功。

在具体游戏的测试中我们可以看到,毕竟是整合的独显核心,其性能不可能超越中端的DX11独立显卡,因此在《天堂2.5》和《失落星球2》的测试中,Llano APU的性能并不足以满足流畅运行游戏的需要,不过独显核心更强的A8 3850勉强能够在中低画质和1280×720分辨率的情况下运行DX11游戏。而Core i5 2500K平台则只能在不打开DX11特效的基础上不太流畅地运行DX11的游戏,PhenomⅡ X4 955搭配的880G主板的游戏成绩更是惨不忍睹,即便是不打开DX11特效,游戏也几乎完全卡死,没有任何游戏性可言。
在DX10和DX9游戏《正当防卫2》、《生化危机5》和《街头霸王4》中,Llano APU不错的3D性能就完全表现出来了,无论是A8 3850还是A6 3650,基本上都能够流畅地运行DX10和DX9的游戏,游戏体验非常不错。当然,Core i5 2500K平台也能比较流畅地运行DX10和DX9的游戏,不过PhenomⅡ X4 955搭配的880G主板的平台只能流畅运行DX9的《街头霸王4》。
USB 3.0性能测试分析

完成了整机及游戏性能测试之后,我们对Llano APU平台A75主板原生的USB 3.0进行了测试,与采用Etron USB 3.0方案的技嘉Z68A-D3H-B3主板、采用asmedia USB 3.0方案的映泰TA880GU3+进行对比,看看Llano APU平台A75主板原生的USB 3.0控制器性能究竟如何。

从测试成绩可以看出Llano APU平台A75主板原生的USB 3.0控制器性能相当出色,尤其是在大文件读写方面,其性能表现还是相当不错的。在小文件读写方面,A75主板原生的USB 3.0控制器表现也比较出色,虽然小文件写入时间稍长,但读取时间更短,总体来说其原生USB 3.0控制器的性能并不输于目前主流的第三方USB 3.0控制芯片。
处理器性能测试分析

测试了Llano APU的3D性能之后,自然要对其处理器性能进行一番比较,从测试成绩可以看到,对于强调多核心处理的Cinbench R11.5 64bit和wPrime这种更强调系统计算性能的测试来说,CPU架构和频率的差距决定了最终的性能差距,而在CPU架构设计上,Core i系列处理器是占据相当优势的,更不用说Core i5 2500K高达3.3GHz的主频,因此在Cinbench R11.5 64bit和wPrime1024M测试项中,Core i5 2500K表现出了非常出色的性能,而高端的A8 3850也有不错的表现,A6 3650的表现则稍差一些。
在WinRAR测试中,由于WinRAR并不能完全利用所有线程和核心来进行处理运算,而且WinRAR的测试表现与系统的磁盘性能也有一定的关系,所以AMD各测试平台的差距并不是特别大,只有Core i5 2500K平台有非常不错的表现。
而视频编码则更考验CPU的多媒体性能,而且对处理器的压力非常大,在这一点上架构更优频率更高的Core i5 2500K是占据绝对优势的,TMPGEnc XPress 4.7.6.304压缩视频时间仅354s。而A8 3850的视频压缩时间高达601s,更不用说A6 3650了。在这一项测试上,相对于Llano APU来说主频更高的PhenomⅡ X4 955拥有更多的性能优势,其视频压缩时间也缩短到534s。
在功耗设计方面,APU还是有不错的表现,尽管其TDP高达100W,不过在进行CPU压力测试时,待机不超过33W,满载不超过128W的功耗表现还是能够令人满意的。当然,Core i5 2500K平台的功耗表现也非常出色,待机40W满载112W是非常令人满意的。在这一点上,TDP高达125W的PhenomⅡX4 955表现就不够令人满意了,待机95W满载150W的功耗实在比较“难看”。
在温度测试方面,由于Llano APU贴心地采用了兼容AM3散热器的方案,因此,我们对AMD的三个平台采用了同一款超频3的双热管风扇。只有TDP高达125W的PhenomⅡ X4 955表现略差,不过三款处理器都保持在50℃左右。由于散热器不能通用,对于Core i5 2500K平台,我们采用了Intel原装的散热器,这导致Core i5 2500K的温度高达78℃,和AMD平台无法进行对比。
混合交火性能测试分析

所有性能测试项完成后,我们针对Llano APU支持的混合交火模式进行了测试。AMD在780G时代就推出过混合交火技术,不过那时的混合交火技术还不够成熟,不仅只能和低端的AMD显卡混合交火,而且在很多测试中我们都能发现,打开混合交火之后,其系统的3D性能并没有提升,甚至还比单独使用独立显卡略低。那么新一代的Llano APU带来的混合交火技术是否能给我们带来惊喜呢?
我们用A6 3650与Radeon HD 6570显卡进行了混合交火的测试,从测试数据可以看到,打开混合交火之后,系统的3D性能有明显的提升,比单独使用Radeon HD6570提升了差不多50%,而比使用A6 3650自带的HD6530D性能的提升幅度接近200%,完全达到了中高端独立显卡的3D性能水平,而这只需要购买一款中低端显卡就能实现。从这个意义上来说,我们认为Llano APU支持的混合交火是很有价值的。

高清视频播放测试
高清视频硬解压播放一直是AMD显卡的强项,那么Llano APU所整合的独显核心是否依然出色?我们使用《完美解码》来测试Llano APU的独显核心的硬解码能力。在《变形金刚2》、《阿凡达》、《盗梦空间》、《速度与激情5》、《魔力女战士》、《X战警3》等采用VC-1、H.264和MPEG-2格式的1080P视频播放中我们发现,无论是A6 3650还是A8 3850,在播放过程中CPU的占用率都在5%以下,大部分时候在0%~3%之间浮动,可以说,Llano APU中整合的独显核心的高清硬解码能力是非常出色的。
延伸阅读:市售主流品牌A75主板
华硕F1A75-V PRO

华硕F1A75-V Pro主板采用ATX大板设计,采用8相数字供电,拥有6个 SATA 6Gbps接口、2条PCI-E ×16插槽,2条PCI-E ×1插槽和3条PCI插槽,配备了 4个USB 3.0接口、2个USB 2.0接口、HDMI接口、DisplayPort接口、VGA接口、DVI接口、E-SATA接口、千兆网卡接口、SPDIF光纤输出接口以及八声道音频接口。这款主板应该是华硕在Llano APU到来时发布的一款代表主板,不仅接口异常丰富,而且做工相当豪华。
映泰TA75A+

映泰 TA75A+主板以ATX大板型设计,采用了5相供电设计,主板提供了6个SATA 6Gbps接口、2个PCI-E ×16独立显卡插槽、2个PCI-E ×1插槽以及2个PCI插槽。映泰 TA75A+主板拥有HDMI接口、DVI接口、VGA接口、2个USB 3.0接口、4个USB2.0接口、1个千兆网络接口以及8声道音频接口。作为最新的A75主板,699元的价格配上映泰不错的做工,还是非常值得的。
昂达A75T魔固版

昂达A75T魔固版主板采用M-ATX小板设计,采用5相供电配置,拥有6个SATA 6Gbps接口、1个PCI-E ×16显卡插槽、1个PCI-E ×1插槽以及1条PCI插槽。主板提供2个PS/2键鼠接口、HDMI接口、DVI接口、VGA接口,1组同轴/光纤接口、2个USB 3.0接口、2个USB2.0接口、1个千兆网络接口以及8声道音频接口。昂达A75T魔固版应该算是目前市场上最便宜的A75主板了,499元的价格是有相当大的杀伤力的,非常适合入门级用户选择。
工程师总结(王宇):
APU带来AMD架构革命
基于AMD Llano APU的“Lynx”平台开创出了一种新型的平台模式,AMD称之为“融合平台”,它具备一定的独立平台以及整合平台的优势,能够提供中低端独立显卡平台的显示性能,并能实现混合交火,而且功耗并不高。
作为AMD今年的重中之重,我们可以说Llano APU确实表现出了不错的性能,从测试中,可以明显地看出Llano APU的特点:在处理器性能测试中的表现并不是特别优秀,不过其整合的独显核心确实表现出了非常不错的3D性能,基本上能够满足低分辨率下中画质的DX9和DX10大型游戏流畅运行的需求。也就是说,在面对主流的大型DX9和DX10单机游戏和网游的时候,Llano APU平台完全能够满足用户的需求了。
而Llano APU对于AMD来说,也是一个创举,继Intel之后,AMD也成功地把北桥和图形核心都放到了处理器内核里面,32nm的制程也表现出了不错的功耗控制,这让APU可以将性能不错的独显核心整合到处理器之中,而且将整个平台的功耗控制得非常好。这种架构的革新带来的好处是非常大的, AMD将可以甩开NVIDIA中低端显卡,而AMD自身的中低端显卡则可以依靠与Llano APU的混合交火来继续存在于市场。同时,这种融合的架构也能够帮助AMD更明确地定位——以Llano APU抢占中低端市场,而以高端的处理器和主板、显卡来争夺高端市场。
期待Llano APU降价
我们知道Llano APU于7月3日在全球市场发售,其中A8 3850售价为135美元(约合人民币870元),A6 3650售价117美元(约合人民币760元)。在AMD的计划中,Llano APU面对的是主流台式机市场,在这个市场上,消费者的预算并不会太高。在这种情况下,Llano APU就能够满足对游戏有一定的要求又没有太多预算的消费者。不过,相对于售价为760元的Core i3 2100来说,除了独显核心的3D游戏性能之外,A6 3650的优势微弱,A75主板和H61主板相比也没有价格优势,这就让消费者有了犹豫的可能。我们认为,如果要想在中低端市场表现得更好,A6 3650的价格应该下降到500元~600元,A8系列也作相应的调价,这样一来,其性价比就会显得非常高,几乎可以称霸中低端市场。