走进万亿级运算时代——Intel 80核处理器技术解析

技术空间

双核处理器,你可能用过;4核处理器,你可能听说过;8核处理器,你可能想过;而当一块80核的处理器放在我们面前的时候,又是什么感觉呢?是激动?兴奋?还是觉得不可思议?

这就是一件被我们大家都认为不可思议的事,现在却实现了。Intel最近宣布他们的有着万亿级浮点运算能力的80核处理器研究成功了。

虚拟现实终成现实

一块小芯片的能力

我们用万亿级运算能力的处理器来做什么?这恐怕是在我们了解它的构成、性能之前更想知道的事情。显然,它的作用不仅是简单用来做文字处理或是玩玩3D游戏,从大体上说,它主要可以应用在娱乐、学习、个人媒体制作和医疗四大领域。

最常见的应用,就是我们日盼夜盼的虚拟现实将会实现。通过3D影像扫描仪,可以将自己的真实影像、工具、场景等物体扫描进计算机。然后你可以在计算机创造的虚拟世界里面控制“自己”的行动。你会住在一个社区,可以劳动,可以赚钱(性质有点类似于现在的“Second Life”)。而当多个人在一起的时候,这种海量数据的运算就需要Intel这个80核的万亿级运算能力强大的处理器才能胜任。

现在,我们最常见的搜索就是打开Google,然后输入一些关键字,再点击“搜索”按钮来简单地搜索一些相关内容。而进入万亿级运算时代后,比如我们到了某个地方,可以用手机拍摄一段该地点的视频,回家后通过计算机,将这些视频传到搜索引擎中,搜索引擎会自动分析、处理这些数据,之后我们就能看到该地点的很多相关视频。这就是传说中的视频搜索。

万亿级处理器的性能究竟有多强呢?给你一个对比的实例。1996年,Intel为美国Sandia国家实验室开发了世界上第一台一秒可以进行万亿次浮点运算的超级计算机ASCI Red,这台计算机使用了104个机柜,占地超过2500平方英尺,约有10000个频率为200MHz的Pentium处理器,功耗为500千瓦。而现在仅仅是一颗80核的处理器,其处理能力就能达到当年如此一个庞然大物的运算水平。

小知识:晶圆是指制作集成电路所用的硅晶片,由于其形状为圆形,故称为晶圆。按直径可分为4英寸、5英寸、6英寸、8英寸等规格,近来发展出12英寸甚至更大规格的。晶圆越大,在同一晶圆上就可以切割出更多的IC,制造成本相应也就更低,但对原料和制造工艺的要求更高。

11-d16-2.jpg
在“主板”上的80核处理器
11-d16-3.jpg
1996年的万亿次浮点运算超级计算机
11-d16-4.jpg
等待切割的晶圆

万亿级的诱惑

80核处理器设计探秘

了解了80核的万亿级运算处理器的应用前景,相信大家一定想迫切地了解这个充满了神秘感的处理器的内部构成。80核的处理器设计起来的方式和现在的双核处理器有类似的地方,但又不完全一样。首先,需要设计好其中一个核心,每个核心内有一个5端口的数据路由器,这些路由器连接在一个被称为“Mesh网络”的结构上以实现核与核之间的通信。使内核与内核之间能以超高带宽进行通信,并且能够在芯片内部以每秒万亿位的速度传输数据。

当设计好第一个核后,再把这个核进行复制,就成了我们现在说的80核处理器。而“80核”这个说法并不是说以后出现的处理器就一定有80个核心,核心的数量是可以任意增减的,并没有一个固定的数目。

前面我们提到,虽然有80个核心和万亿级的运算能力,但该处理器的功耗却不算大,甚至可以说很低(频率为3.16GHz,运算能力为1.01 Teraflops时的功耗仅消耗62W),比现在的很多单核处理器功耗还低。除了架构上的优势外,这主要归功于它的“细粒度能源管理”机制:每个核心的计算引擎和数据路由器都可以根据用户所进行的应用和对性能的要求来激活或转入睡眠状态。

万亿级处理器还具有为既定计算任务节约能耗的能力。这意味着不重要或高度并行的工作负载能够以较低的频率运行,从而大大降低了能耗。对于关键任务或高度串行的任务部分,则可以通过临时提升频率来提高性能。

我们从表中也能看出,虽然性能提升仍然可以通过提高频率来实现,但在功耗方面却要付出很大的代价。

11-d16-5.jpg
核心内部结构
11-d16-6.jpg
未来的万亿级处理器的每个核心都有独立的高速缓存,这些缓存又相互连接
11-d16-b1.jpg

意义

80核处理器对当前处理器的影响

现在看来,80核的处理器不会马上就直接应用在我们的PC或其他商用设备上,但今后几年里,它对我们在处理器方面的研究却具有重大意义。在对80核处理器的研究过程中,我们曾经遇到很多难题,如在能源方面的管理和多核处理器该如何使用缓存等。

在80核处理器中,大量模块化的内核内建的高速缓存和片内内存的电路设计显著提高了使用效率。与当前处理器的电路相比,寄存器组的传输速度是现在的缓存无法比拟的。 “Mesh 网络”与现有的多核芯片的互联方案相比,这个“Mesh 互联方案”具有更高的可扩展性、更好的内核间通信能力,并可提供更高的处理器性能。

以上这些难题在研究80核处理器的过程中都被解决了,将这些技术直接运用到将要推出的处理器上,无疑是处理器发展中的一个重大突破。

11-d16-7.jpg
10、20、80、200核心的处理器将逐渐被应用到各个领域

发展

80核处理器会取代显卡吗?

我们天天都说让显卡的GPU来取代CPU,而且现在看来也完全有这个趋势。但当80核的处理器出来以后,我们突然发现,这么多个核心全用来当“CPU”使用是不是太浪费了?它的功能应该不仅仅停留在CPU的范畴里,它还能胜任GPU的全部工作。以后到底是GPU取代CPU,还是CPU取代GPU?又一轮的技术大战将因80核处理器的出现拉开新的一幕。