6亿元造出来的计算机
头条
拥有近14万枚CPU核心;
存储容量高达2PB(1PB等于100万GB);
最高带宽达到69.6TB/s(1TB等于1000GB);
每秒峰值运算达1.07千万亿次,相当于20万台普通笔记本同时运算能力;
研发投资达到6亿元人民币;
……
显然,这不是一台普通的电脑,这是中国首台自主研发CPU和底层系统的千万亿次超级计算机神威蓝光。
10月13日,带着几分好奇,电脑报记者来到国家超级计算济南中心,第一次了解到神威蓝光的诸多细节,也见到了与这台国产超级计算机朝夕相处的一群科学家。
本报记者在神威蓝光超级计算机旁边

走进超级计算机的心脏
没有想象中巨大,神威蓝光就是一个放大的“0”躺在机房里,走进它,如果不是旁边一排商业服务器的噪声提醒,从外面封闭的外壳难以察觉它的运行。
国家超级计算济南中心陈德训研究员像魔法师一样为记者打开了三扇门。
第一扇“0”型头部的一扇门,映入记者眼帘的是晶莹透明、手指粗细的水管,有序地排列在两排机架上,与地板下的制冷系统相连,用手摸一下这些水管,都是冰凉的感觉。
第二扇门打开,是配列整齐的128个计算节点,每计算节点包含8颗国产CPU,128个核,一万亿次的浮点计算能力。
第三扇门打开的时候,就是一个空的椭圆形小房间,“这里有什么宝贝?”记者问。
“进来吧,感受一下安静。”陈德训邀请记者走进蓝光超级计算机的内部,“环形墙”原来是9个计算机仓和2个网络机仓,除了网络连线上的指示灯闪烁,这里简直可以当作是静修的空间。
“这就是神威蓝光的主机部分”,总工程师周明忠研究员说包含13万9千个核的主机只占用60平方米的机房,与其庞大的计算能力相比,确实是小巧玲珑。
神威蓝光从2011年9月整个系统安装加电测试以来,一直就是保持24小时的开机运行状态。
“关键是主机的CPU和底层软硬件系统全部是国内自主研发生产的,使中国成为继美国、日本之后,世界上第三个具有独立研发千万亿次超级计算机系统的国家。”陈德训和所有研究员都倍感自豪。
最神秘的神威蓝光的CPU,是全球第一颗16核CPU,比AMD的要早6个月,基础和并行操作系统、资源管理系统、多核编译器、并行编译器、海量并行文件系统、多核数学库则是自主研发的软件成果。
此时是10月13日12:08,从主机房外监控室的屏幕上,看到此刻正忙着的CPU是7760个,系统为正在运行的项目配置了8704颗CPU,屏幕上绿色显示闲着的CPU主要分布在第3号机仓。
“正在运行的是什么计算?”
“我们并不清楚每个计算项目的具体运行内容,监控主要是看机器性能配置,发现有问题会及时自动处理。”
“通常一次运算要多少时间?”
“一天的计算时间是最短的项目,项目一周左右的计算时间比较普遍。”
“怎么知道在这里跑的运算项目没有暗藏恶意代码?”
“运行前有一套安全检测程序会保证机器安全。”研究员对记者的疑问一一耐心解答。
超级计算应用每一天
还有什么比超级计算机的应用更接近人们的生活?每天我们要看的天气预报就是最广泛的应用。
“如果需要,我们可以推算1000年后的气候情况。”周总工说,人类自1850年有天象记录以后,就产生了一系列气象数据,专家们可以根据历史数据建立数学模型,推演过去1000年或者未来1000年的气候变化。
现在天气预报的数据实际上是每小时都会有一个新的计算结果,气象部门还要参考其他气象因素对数值预报结果进行会商、矫正,然后才能对外发布预告数据。
类似的应用还有海洋数据分析,可以了解海底地貌几千年前的形状,其他的成熟应用还有石油勘探、金融分析、农业上基因育种筛选、动漫产业等等。
济南超算中心的定位是为黄河三角洲及半岛经济服务,全国一半以上海洋研究机构都在山东省,为海洋数值模拟服务就是济南超算的主要任务。
不过,这些应用的软件完全自主研发的很少,大都采用国际共享开源的软件,国内在应用上的研发缺失让济南超算中心研发部总经理潘景山感到一丝遗憾。
据介绍,目前国内国家级四大超算中心,包括长沙、天津、深圳中心都是采用CPU+GPU为主的异构架构,只有济南中心完全采用国产CPU和基础软硬件系统,机器成本比采用国外处理器的成本低,但研发成本相对较大。
应用软件的开发不是一个简单的过程,需要计算专家、行业专家共同参与,一个项目的开发需要200人年左右,投入使用年限都在10年以上。
“美国三大实验室,有几千人在应用领域研发,真正从事运维的只有数百人。”潘景山对比国外对超算应用领域的重视,看到济南超算中心从事运维和研发的员工刚到40位,很有压力。
国外在超算系统与应用的开发投入在1:2 或者是1:3的比例,国内在软件应用上投入的人力资金仅有硬件系统的1/5或更少。
“大型软件,像海洋、气象这类,上世纪70年代的代码、90年代的代码都可以找到,是长期积累下来的东西,海洋、气象、天气软件可以免费使用,但更多应用领域需要自行研发,我们现在是有大量数据,缺应用工具,眼看着数据但不能挖掘出智慧。”
神威蓝光运行以来,很多个周末潘景山就是和同事们一起在超算中心加班度过的,记者进行采访的这个周六也是他们众多工作日的普通一天。