疯狂博士带你看超算
头条
到底超级计算机是个什么样子?它和普通电脑有什么不同?
10月13日,疯狂博士亲自深入国家超级计算机济南中心,为大家揭开超级计算机神秘的面纱!
超算机房看究竟
走进神威蓝光超级计算机的机房,可以看到很多立式的机柜,在机房正中间摆成一圈的机柜正是神威蓝光,旁边排成一行的是常规的X86架构服务器机柜。
疯狂博士也见过不少大型机房,不过神威蓝光给我的最大印象就是非常安静!和旁边发出巨大噪音的X86服务器形成了鲜明的对比。
据工程师介绍,神威蓝光全部采用水冷设计,一是比风冷省电,二是几乎零噪音(这个我们后面详细介绍)。
工程师打开机柜,一层层的刀片机映入眼帘。经工程师介绍,每一片计算节点上有8颗国产处理器,每颗处理器有16个物理核心,每颗处理器配备了16GB DDR3内存。
疯狂博士发现刀片机上有三个电源开关,原来每一片都配备了三个独立的电源,就算有一个坏掉,另两个也能及时补上,大大保证了服务器的可靠性和稳定性(三个一起坏?这几率太太太小了)。
从机柜背后可以看到,各个节点之间是用光纤进行连接的,这样才能保证足够的数据带宽;而刀片机之间是直接用PCB连接的,数据带宽更高。
那么千兆网线这样显得比较“慢”的网络连接是用来做什么的呢?其实是用来连接监控单元的,监控对于数据带宽要求很低,所以一般的网络就行了。

打开其中一台机柜,可以看到很多层刀片机

水冷散热系统的储水管,左边的小管子用来观察水位

一排排透明的管子正是神威蓝光所用的水冷系统

为什么每一片计算节点有三个电源开关?因为一层有三部电源,两部供电,一部备用。

机柜中黄色的是光纤线(内部数据通信),蓝色的是千兆网线(与控制室通信),各单元之间直接用PCB连接进行通信
超频用水冷?超算也用水冷!
一提到水冷散热系统,恐怕大家最先想到的就是发烧玩家玩超频的必备神器了。
其实,神威蓝光超级计算机也是采用的水冷散热系统,而且这也是它最有特色的设计之一。
首先,这套给超级计算机使用的水冷系统非常安静,基本上可以算是零噪音了。
其次,它非常节能,远比常规的散热系统省电得多,毕竟只需要驱动功率不算大的水泵,而且在冬天,济南的室外温度很低,冷却水在室外实现自然冷却,散热效率更高。
再次,这套水冷散热系统的运营成本也很低,一年的冷却水损耗率才30%(其他超级计算机采用的水冷系统蒸发量远高于它)。
超算拆开给你看!
这里需要说明一下,和我国其他几个超级计算机中心所用的CPU+GPU方案不同的是,神威蓝光采用的是完全自主开发的纯CPU方案。
其中申威SW1600采用的架构与X86、ARM完全不同,采用自己的编译器和软件,具备16个物理核心(一般台式机上最多才8核),频率为1GHz,每颗CPU搭配16GB DDR3 1066内存。
看到这里玩家可能有疑问,怎么才1GHz?现在台式机的处理器默认频率都快破4GHz了。其实不能这么比较,申威SW1600的架构不同于X86和ARM(X86和ARM兼容的软件无法直接在它上面运行,因此拥有很好的安全性),而且针对的数据与应用也不同于一般台式机,所以不能单纯从频率来衡量。
另外,从结构图上也可以看到,申威SW1600内部有4个核心组,也就是说每个核心组包含了4个物理核心,由交叉开关来进行动态调节计算负载。
再来看看一个计算单元的主板,两颗采用BGA封装的申威SW1600直接焊接在主板上面,周围是DDR3内存颗粒,每颗CPU分配了16GB内存。
疯狂博士仔细观察了一下主板上的供电电路,一共是11+1相供电,相当于高端Z77等主板的供电规格, 看来申威SW1600的功耗应该和普通台式机处理器差不多!
