超级电脑与基因

Author: 信海光 熊川 Date: 2001年 7期

#1    换上防尘鞋,穿上白大褂。
  ?牐牸负跏瞧磷『粑呓蟮募扑慊行末ぉぞ褪钦饫锎?理了中国分担的1%人类基因组测序任务所产生的海量信息,但也许并没有多少人知道,就是这里藏着中国为数极少的曙光2000巨型计算机,而2月17日才正式推出的曙光3000也将在这里安家落户。
  ?牐犓蔷痛A⒃谖业难矍埃刻ㄓ薪矫赘撸幻锥嗫恚投悦姘诜抛诺钠胀ㄌㄊ交槐龋缘煤琢⒓θ骸?
  #1    人类三大工程的功臣
  ?牐牎爸泄司嗬肷蒲У氖澜缜把赜卸嘣叮看哟讼蛭魇紫蜃罂窗桑 ?
  ?牐犜诎咨幕蠡蜓芯恐行娜ィ紫扔橙胙哿钡氖乔缴系恼庖恍凶帧?
  ?牐?2月12日,人类基因组图谱向全世界公布,作为中国基因测序的主基地,位于北京东部空港科技创业园的华大基因研究中心成了焦点。中心有70多人,但这里给人的第一感觉仍是一片寂静。
  ?牐犗蛭魇祝蜃罂矗且慌排诺幕虿庑蛞牵褪钦庑┗鳎械A酥泄娜死嗷蜃榈牟庑蛉挝瘛H欢獠⒉皇俏掖诵械闹氐悖业闹氐闶窃偻魇椎纳镄畔⒅行摹?
  ?牐牼褪钦饫铮刻彀鸦虿庑蛩暮A啃畔⒂贸兜缒越写?理、分析,把有用的信息反馈给生物学家,以研究哪些基因可造福于人类。
  ?牐犎死嗷蜃榧苹敲拦蒲Ъ矣?1985年率先提出的,旨在阐明人类基因组30亿个碱基对的序列。人类基因组测序就是在天文数字般的DNA片断中寻找属于人的基因,据估算,平均人类每一百万个DNA片断中,只有12个基因。在上百万个鱼龙混杂的DNA中寻找12个基因,这无异于大海捞针。
  ?牐犝蛭绱耍死嗷蜃榧苹庞?40年代的曼哈顿原子弹计划、60年代的阿波罗登月计划一起被并称为人类科学史上的三大工程。
  ?牐犎绻德僭拥苹思扑慊牡统沙ぃ敲窗⒉?罗登月计划则使计算机获得了长足的发展,它也是人类第一次大规模使用计算机来完成一项巨大的工程。而人类基因组测序计划则是又一次对计算机的考验,它对未来计算机的发展方向有着重要意义。
  ?牐犎死嗷蜃橥计坠谥谝馕蹲派急换婢停嗣堑纳钜步⑸薮蟊浠@没蛑瘟聘嗟募膊〔辉偈且桓錾萃芏嗉膊〉牟∫蚪唤铱?21世纪的医学基础由此奠定。利用基因,人们提高农作物的品质,更多的转基因植物和动物食品将问世。通过控制人体的生化特性,人类将能够恢复或修复人体细胞和器官的功能,甚至改变人类的进化过程。
  ?牐犜谡庀钗按蟮某删椭校兜缒怨Σ豢擅弧;蠡蜓芯恐行氖褂玫氖枪锕?2000型超级巨型机。(^07010101a^)
  #1    曙光超级电脑
  ?牐犝驹诰薮蟮氖锕?2000旁边,华大信息中心副主管孙健冬显得有点矮小。
  ?牐犓锝《嫠呒钦撸蛭?理基因测序所产生的海量信息,生物信息中心使用的高性能的计算机必须有几个特点:运算速度要快、内存容量要大、存储量更要大。信息中心一天信息产出量就有20G。这个数据令人振奋,在国外基因研究中最领先的塞莱拉公司,其日数据产生量也不过如此。这20G的原始数据如果再被拼接、处理的话,整个量是极其惊人的。现在市场上最好的PC机75G容量硬盘仅仅能装这里一天的信息量。
  ?牐犛捎谑锕?2000计算机已超负荷运转,不能胜任。华大又订购了最新的曙光3000计算机,3月20日将要运到,它的硬盘将是2T(2000G),相当于200台高档PC的容量,而这也顶不了多少,信息中心的要求是20T才是理想配置。
  ?牐牰杂谀诖胬此担锕?2000一共有四个节点,每个节点带2G的内存,一共是16G内存(16000兆),而目前市场上很高档的PC的内存也就256兆而已。曙光2000的峰值运算速度是3000亿次/秒。国内还有其它两款超级电脑,分别是神威、银河,主要应用于国防科研领域。
  ?牐犑锕?2000的造价是2500万元人民币,即将使用的曙光3000是国家重点科研项目,首批供应全国三台,而华大一下子就订购了其中的两台。由于这两台机器的存在及使用,华大还被有关部门定为“国家高性能计算中心”。孙健冬告诉记者:“曙光2000在其它领域可能会运转得很正常,但在华大已经是不堪重负。不得不一次买了两台曙光3000。”
  ?牐犑锕?3000的发布会于2月17日在北京举行,记者找到了国家曙光超级电脑计划总工程师徐志伟先生,他告诉记者,曙光3000峰值速度超过每秒1万亿次,1/16的曙光3000计算能力每天可实现80亿次的页面点击。1/32的计算能力每天可收发7000万封电子邮件。1/64的计算能力每天可处理400多万次事务。1/4的计算能力工作,一个月的气候预报仅用15分钟。
  #1    中国人追上来了
  ?牐犑导噬希谌蚍段?内,即使如今最强大的超级电脑也不能满足基因时代的计算需求。为此,美国能源部一举联合了生物信息领域、高性能计算领域和巨型并行系统领域的三个领导者:塞莱拉基因中心、康柏、Sandia国家实验室来应对基因时代对计算机的挑战。三方联合研究的目标是首先实现每秒100万亿次运算,最终将可能实现每秒千万亿次运算。
  ?牐犗衷冢泄某兜缒哉弊访拦钕冉乃健U蛭锕饧扑慊某鱿郑承┕也欧趴砹硕曰扑慊隹诘南拗啤T诖饲埃泄虢诒仁锕?2000还差的高性能计算机都很难。曙光2000出现以后,像康柏、Sun已经可以向中国出口满载50个CPU的高性能计算机。而在2月17日推出的曙光3000,将至少能装载64个CPU。这将迫使美国进一步修改它对中国禁运超级电脑的条款。在价格上,与进口的同配置高性能计算机相比,国产机便宜很多。(^07010101b^)
  ?牐牫兜缒宰魑易酆鲜盗Φ南笳鳎恢笔侨毡竞兔拦阕肺腋系木杭汲 5绻?863计划智能计算机主题专家刘澎2月16日告诉记者的那样,中国的超级机算机现在已在第一阵营,我们在这超级电脑领域与美国只有很小的差距。曙光3000强大的处理能力、可扩展性的体系结构、超大的存储系统、基于网络的访问和提交能力及强劲可靠的操作系统,将让我国的超级电脑在世界基因研究和其他尖端应用赛场成为令人生畏的对手。日美专家惊呼:“中国人追上来了!”