4万亿次的精彩

综合报道

  4万亿次和10万亿次

  2003年12月9日到15日,是中国超级计算领域很不平静的几天。

  在12月9日,科技部携手联想集团在京宣布,由联想研制的国家网格主节点“深腾6800”超级计算机通过鉴定、研制成功。深腾6800网格超级计算机基于服务器集群体系结构,包括265个4路IA64节点,1060个主频为1.3GHz的英特尔安腾2处理器,其内存总容量为2.2TB(1TB=1024GB),磁盘总容量为81TB。

联想深腾6800,这也是迄今为止中国超级计算机在TOP500中成绩最好的一台

  其实,早在今年11月16日,最新出炉的TOP500中,(TOP500又称“全球最新超级计算机500强”,是目前公认权威性较高的,关于世界上已安装并正在使用的超级计算机的排行榜,每年6月、11月发布。)就可以看到深腾6800的消息,只不过这个名单还在使用联想的旧英文标志:“LEGEND”。

  在这次TOP500排行榜中,深腾6800取得了很好的成绩,包括以4.183万亿次/秒的实际运算速度居第14位;LINPACK效率为78.5%(LINPACK测试是测试超级计算机性能的权威方法,主要用于分析缓存、内存系统性能),位居TOP500前15名中的第2位;在事务处理能力TPC-H测试的性能比较中,“深腾6800”名列世界同类系统第4。

  这些数字大大刺激了国内超级计算领域的领导厂商曙光。虽然,在这之前不久,运算速度4.2万亿次/秒的曙光4000L超级计算机已经部署到中石油东方地球物理公司。但联想的举动还是让曙光感到有些紧张。

  深腾6800宣布中标的单位是CNIC,即中科院计算机网络信息中心。然而更重要的是,深腾6800将在CNIC被用做“国家网格计划”的北京主节点。

  2002年4月启动的中国国家网格计划立足于建设国际级的高性能计算和信息服务基础设施,将连接国内多个研究和信息服务机构的超级计算机。其中,上海和北京是两个主节点。整个计划中性能最强的两台超级计算机即将安装在这两地。

  因此,曙光在12月15日对外界公布:曙光公司的10万亿次曙光4000A中标上海超级计算中心,将用于网格计算的海量信息服务及数据交互工作,成为中国国家网格最大的主节点机。

  让联想感到不满的是,以“10万亿次”压倒“4万亿次”,大大抢了深腾6800风头的曙光4000A并没有建造完成。曙光总裁历军告诉记者:“曙光4000A将在2004年6月全面建成,它采用了2000多个AMD Opteron 64位处理器”。

  而曙光4000A中标上海超级计算中心,正是国家网格计划的另一大主节点。

  然而,从更高的层面来看,中国国家网格计划的两大节点都采用了国内企业生产的超级计算机作为主节点,这对中国IT发展的里程碑式意义,恐怕才是这个12月里最应该被记住的事情。

  超级计算机也能DIY

  为了摸清中国超级计算机的技术家底,记者先后采访了联想集团高级副总裁乔松、深腾超级计算机的总负责人祝明发、曙光集团总裁历军等人。

  与联想和曙光采用的服务器/PC集群架构相对应的是采用RISC架构的大型机。RISC架构采用了简单和统一的指令格式,封闭的专有UNIX操作系统,以及在这种封闭系统上开发的应用软件。它的特点在于具有很好的稳定性和很高的运算效能,应用软件丰富。缺点是通用性差,而且价格非常昂贵,只有少数国外厂商手中才掌握有核心技术。

  而服务器/PC集群架构的服务器则相对简单和容易理解得多,简单而言分为三个层面,底层的硬件部分就是一个个独立的PC服务器,之间用以太网连起来。节点的软件部分采用LINUX操作系统,目前的主流是红帽7.2版本。将多个节点连接起来就形成集群,集群还有一个软件管理系统。此外,还设有监控、冗余等系统用于保证系统的正常运行。

  服务器/PC集群架构正大行其道,它的发展速度大大超过了大型机。在TOP500排行第三位,运算速度超过10万亿次/秒的美国维吉尼亚大学的高性能计算集群,就是该校师生用1100个Dual 2.0 GHz的苹果G5处理器,基于CLUSTER(集群)架构而建造的。在TOP500的前10名里,IA架构已居其六,而RISC架构仅占其四。

  只要愿意增加成本,也就是购买更多的CPU和更快的光纤网络交换机,服务器/PC集群架构的超级服务器几乎可以无限地扩展运算能力。祝明发教授说:“只要有客户愿意要,这种架构做到50万亿次也没有问题”。

  这种架构让中国这样可能受到高性能计算机禁运的国家获得了一种几乎可以不受任何限制就扩充计算能力的可能性。

  很多的中国高校已经开始这么做,在今年10月开始的中国教育科研网格计划里,要求首批参与的12所高校各建立一台5000亿次/秒以上的超级计算机。其中除了上海的一家高校选择了IBM的大型机外,大部分高校都选择了自己建立服务器/PC集群架构的计算机集群。记者采访教育部科研网格计划专家组组长金海教授时,他曾告诉记者:“这种架构技术开放,有一定技术实力的学校完全可以自己做,自己维护,还可以利用这个过程优化系统,其实也是搞科研;另外,这种架构的机器性价比非常高,适合学校和科研单位。”

  这似乎和PC领域内的DIY很相似,虽然超级计算机的建造者们面对的是上千颗CPU和更为复杂的部件,但他们从事的活动本质是接近的。可以想见,随着CPU运算能力不断扩大,以及局域网环境的不断成熟,这种DIY方式的超级计算机或许有一天会走近个人用户。

  我们真的掌握核心技术了吗?

  中国在1987年首次发布银河I号亿次计算机的消息,成为当年中考“时事政治”的一道考题,也成为当年明星级的科技新闻。今天,中国企业发布万亿次计算机,已经远远没有了当年的轰动效应。

  一位参与银河机研制的老专家说了这样一番话:“今天联想、曙光搞出来4万亿次/秒、10万亿次/秒机,我不把它们当做一个大新闻。因为它们基于一个成熟开放的平台,技术规范、硬件、软件基本上都是国外现成的,企业做的只是把它们组装起来而已。这和当年在封闭环境下,开发出我国全部自行设计的100万次/秒、1000万次/秒计算机,在技术难度和技术进步的意义上,不可同日而语。”

  这种观点虽然略显尖锐,但也是很多人心中的疑问:如果什么都是用的别人的,中国在超级计算机上的核心技术又怎么体现出来?

  科技部秘书长石定环在深腾6800发布现场的发言里说:“联想深腾6800的课题组成功把技术创新和消化吸收成熟技术相结合,自主开发和采用商品化部件、开放源代码软件相结合,充分听取用户的需求和意见,才能在短时间内完成如此规模系统的开发”。

  祝明发的回答是:“处理器、操作系统不是我们的事情。联想定位于一个系统商,现在就是要把系统做好,从这个层面我们是和惠普这样一些世界级的系统供应商在比。从深腾6800的一些指标来看,我们和惠普是在一个水平上的。”

  作为一个系统制造商,要解决的不是如何建的问题,而是在同样的技术规范下,怎么在细节上做到尽善尽美,在局部进行创新改革的问题,如何满足客户应用需求的问题。

  “此次联想在研制作为国家网格主节点的4万亿次/秒计算机的过程中,共申请了38项专利,有31项是发明专利,其中在集群系统软件方面是自行研制的。另外,还有一些技术心得。比如在系统均衡的设计思路下,我们加大了I/O通路,系统的效率得到了提高等,这些都是我们的发明创造。” 祝明发介绍说。

  历军的定位则稍有不同,作为计算所出身的企业,曙光给人的印象是技术气息更浓郁一些。历军和本报记者讨论的一个问题是“如何区分核心技术和底层技术”,用他的话说就是:“核心技术不是说要多高多深,高到神舟五号那个水平。而是一种别人不给你,你就没有的技术。”。

  一方面,历军很自豪地列举了曙光4000A在研发过程中的一些技术创新。“在曙光4000A的研制过程中,我们突破了原有技术瓶颈,使这台10万亿次的大家伙配备了具有自主知识产权的5Gbps高速互联网络和通信协议。”

  另一方面,历军亦坦承:“CPU、操作系统用的还是别人的。”他向记者透露,2005年-2006年间,曙光将推出基于“龙芯Ⅲ”的高性能计算机。

  如果历军所言能够如期实现,中国将在2005年到2006年拥有自主CPU核心技术的高性能计算机,这个日子并不太远了。