移动方寸间 走进“苹果核”

技术讲坛

正如传统电脑一样,其中的CPU和GPU配置已成为大家评价平板电脑性能的重要参数。与众不同的是,苹果iPad这个移动终端平台不再如Macbook那样归属于x86的世界,它已经变成了ARM的新领地。今天,我们将带领大家走进“苹果核”世界!

A4引领平板“芯”时代

如同其他移动终端平台一样,苹果iPad采用的“芯”也是基于SoC(系统级芯片)方案。目前平板电脑芯片大部分以SoC的形式存在,一个芯片上集成了CPU、GPU和内存控制器等。可以说,如NVIDIA的Tegra一样,iPad所采用的A4处理器不再是单纯的“处理器”,而被称为“系统级芯片”。与传统电脑结构类似,决定SoC芯片性能的两个重要组成单元仍是通用处理核心(CPU)和图形处理核心(GPU)。

26-e10-1-1.jpg
26-e10-1-2.jpg

1. 处理核心3D层叠

在通用处理核心上,A4没有采用自家的处理器技术,而是投到了ARM的门下——ARM Cortex-A8。Cortex-A8是第一款基于ARMv7架构的应用处理器,也是有史以来ARM开发的性能最高、最具效率的处理器。厂商可以根据需要、生产技术,让Cortex-A8处理器的速率在600MHz~1GHz的范围内调节,而苹果对Cortex-A8加以优化后使A4最高可以运行在1GHz频率下。

基于ARM Cortex-A8核心,让A4看上去和当时的主流ARM方案并没有什么不同,但它的亮点是在制造技术上。iPad、iPhone 4内部的工业设计之所以可以达到如此高的集成度,其中A4芯片也是一大功臣。A4基于45nm工艺,使用了3D层叠技术封装,集成了内存控制器,大大减少了占用面积,这也是iPad能做得这么轻薄的原因之一。3D层叠技术就是将若干2D芯片在连线层级连接起来。当然,最“粗糙”的连接就是封装,这可以大大增加芯片功能模块的集成度。A4处理器的内核由8层电路板构成,封装内核的芯片通过金线键合堆叠到基板上,同样通过金线再将两个基板键合,然后整个封装成一个元件便是内置器件。

2. PowerVR SGX图形核心

在图形模块方面,A4采用的是PowerVR SGX图形核心,隶属于Imagination Technologies公司的PowerVR,它在20世纪90年代曾是3dfx Voodoo的主要竞争对手,在后来的市场竞争中,这两个品牌都从PC市场消失了,PowerVR转入了移动GPU领域。虽然PowerVR在桌面平台上难以和NVIDIA、AMD竞争,但在转向超便携、超低功耗平台后,PowerVR却有着不错的表现,诸如OpenGL 2.0、OpenGL VG 1.0以及DirectX 9.0L等诸多规格都做到了完美支持。

PowerVR SGX采用先进的可编程设计,虽然结构方面更偏向传统的图形核心,但也借鉴了通用流处理器的设计优势,要知道,该特点在桌面显卡GeForce 4系列中才得以实现。PowerVR SGX最多可拥有16个图形核心,每个Core拥有4个渲染管线,总共拥有64个USSE2图形管线。其中A4采用的是PowerVR SGX 535图形处理器,核心频率达到了200MHz,高达7M/s的三角形生成率,250M/s的像素填充率,性能已经和GeForce2 GTS基本相当。

当然,3D性能仅仅是用户要求的一个方面,通常超便携设备最好能具备对影片的解码能力,从而可大大扩展平台的使用范围。在视频解码方面,苹果A4并没有如其他SoC方案那样选择具有视频硬解的PowerVR VXD370,而采用VXD375芯片——它只能通过软解支持720P的H.264 MP4格式解码。

之所以这样搭配,是因为A4处理器和软件对这种视频的解码能力最强,目前苹果是唯一一个既做硬件又做软件的手持设备公司。也只有苹果可以在硬件中插入对软件的优化,又可以在软件中用上特制的模块。苹果最擅长的就是产品功能集成化设计,如果要充分发挥这些集成功能的优势,最有效的方法就是为它们设计专用集成电路,而不是采用通用型处理器来负责处理和实现这些功能。苹果在A4上进行了最大程度的优化和定制,摒弃了iPhone、iPad所不需要的模块,让它可以在处理速度和省电性能上做到最佳,这正是A4的成功之处。

3. A4省电节能30%

苹果A4另一个亮点就是极其省电:待机耗电大约只有竞争对手的30%,耗电更只有25%~75%。苹果A4之所以省电,其秘密就是采用了P.A Semi的独立唤醒技术。这项技术有点类似于目前桌面处理器上的功率门控技术,它能够关闭部分未使用的芯片,也就是不用的东西让它睡着,用的时候再叫醒。苹果A4的耗电量极小,使iPad整机的耗电量水平可以维持在2.5W的水平,电池续航时间超过10个小时,也让iPad成为有史以来待机时间最长的平板。这样的水准仍是目前众多平板电脑厂商所努力的标杆。

从产品设计来看,A4是一款相当成功的SoC方案,即便是从今天的角度来看,iPad辉煌背后,正因为有着A4的支持。

A5不再一“芯”一意

2010年,iPad的出现,让我们记住了苹果A4这一名字。2011年,苹果推出了iPad 2时,拿出了更重要的一款新的处理器——A5!

1.两个处理核心

与A4相比,A5的CPU模块由单核心ARM Cortex-A8变成了双核心ARM Cortex-A9,各个 Cortex-A9处理核心配备64KB的L1高速缓存,指令和数据缓存各有32KB,所有核心可以共享芯片上的1MB L2缓存。Cortex-A9比Cortex-A8具备更浅的管线阶层,这就意味着每个时钟周期可以做更多的任务。它有着一个设计更为先进的执行引擎,这使得它每个时钟周期可以执行更多任务。在相同的时钟频率下Cortex-A9的性能要比Cortex-A8提升25%。这仅仅是单一A9核心的性能增幅,而A5拥有两个A9处理核心。双A9处理单元可以多线程地执行代码,你可以试想一下A5会比A4的处理性能高出多少。

除了核心增加一倍外,A5所采用的Cortex-A9 CPU架构也出现了变化。Cortex-A8采用的是双指令解码管线,程序指令采用的是In-Order执行(即顺序执行,只能按固定的优先级处理,处理速度较慢)。如果以Intel CPU进行对比,差不多相当于其Pentium时代产品。而Cortex-A9虽然同样采用的是双指令解码,但是其指令执行顺序为Out-of-Order(乱序执行,可以多任务并行执行,最大限度发挥处理器的效能,处理速度快),容许量方面相差25%。不过有时平板电脑对功耗控制往往更重要于性能,考虑到双核Cortex-A9对功耗的影响,A5除了将制程工艺由45nm升级为40nm外,还采用了比A4更优秀的电源管理电路设计,可以让Cortex-A9处理核心随当前运行的应用程序而改变运行频率。

2.图形性能提升一倍

硬件规格的大幅升级让A5的图形性能较A4有明显的提升,A5升级到性能更强的PowerVR SGX 543MP2核心。SGX 543采用模块化设计,单个核心的峰值浮点性能就是A4所采用的SGX 535的两倍,A5使用的是双核心版本,图形引擎数量增加到了32个。

SGX 543MP2有四个USSE2管道,采用统一的架构,无论是顶点着色器还是像素着色器代码都在同一组硬件上运行。这种方法的好处是,当图形芯片处于性能的最高峰时能够获得更好的性能。

26-e10-1-3.jpg
26-e10-1-4.jpg

3. 更多的设计特点

除去双核CPU+双核GPU架构之外,苹果还向A5中加入了另外的专用逻辑电路实现对功能集成的支持,从而让自己在功能集成方面的优势得以进一步发挥。比如A5还集成了侦测控制单元、加速器一致性端口、通用中断控制器等先进技术,能更好地发挥双核心的优势。可以预计,在A系列处理器后续产品的设计中,苹果还将继续沿专用逻辑电路模块设计的路线走下去。

虽然A5的性能较A4有了较大提升,但它对整个业界的影响远远没有达到A4的水平,充其量只算是硬件规格上的提升。另外,NVIDIA采用四核架构的Tegra 3、索尼的四核NGP都已经蓄势待发,A5要实现统领掌上数码设备,延续A4时代的辉煌的梦想并不容易。

写在最后

虽然苹果在ARM阵营中算是后起之秀,但它的加入为ARM处理器注入了新的设计理念、新的技术和活力。从A4、A5处理器我们可以看到,ARM处理器在未来具有广阔的发展前景。ARM最新的Cortex-A15处理器已经初见端倪,十分令人期待,不知它能否成为苹果下一代A6的内“芯”呢?