智能化,企业计算的未来

行业观察

当越来越多的企业对企业计算不再陌生时,企业计算在不知不觉中走入了一个新的发展阶段——智能计算。在9月15日举行的英特尔智能商用计算体验峰会上,英特尔与产业合作伙伴、高性能计算用户及数据中心用户等一起探讨了企业计算的智能化发展趋势。实际上,在今年3月底英特尔至强5500系列服务器平台发布之后,智能计算就已经在商业计算领域“蔓延”开来。“服务器的发展呈现出四大趋势:性能不断提升、绿色高能效、虚拟化、刀片,这四大趋势显示了服务器市场对于智能计算的呼唤。”IDC中国计算系统研究主管崔轶然表达了自己的看法。

智能计算带来实效

到目前为止,专注于高性能计算和大规模数据中心应用的一些行业客户,迅速部署了基于至强5500的服务器,一些行业用户认为,至强5500系列服务器平台的智能性及灵活的虚拟化技术、9:1的服务器整合比、8个月内收回成本等优势都是他们部署时所看重的。

何为智能计算?英特尔企业方案部总监凌琦认为,智能计算是希望在用户的实际操作环境下,能够自动适应并满足以下几个条件:第一,发挥最大的作用、最大的能效和性能;第二,能够针对市场环境、现场环境、应用环境,充分地调配资源;第三,能够给最终用户带来最好的性价比,换句话说就是降低应用成本。

“实际上,所有服务器都是沿着这个方向在发展的。”凌琦还通过不同的飞机来比喻服务器的智能化,“战斗机需要超音速,需要跑得快,最好要有多个发动机,这样能够跑得更快、更灵活。而运输机、客机要的是稳定、容量大,能够在最短时间把大量的人或者货物运送到另外一个地方,考虑的是燃油经济性。如果是滑翔机,需要在没有动力或很小动力的情况下,在空中停留更多时间,给飞行者带来更多乐趣。”

HPC和IDC离不开智能计算

在很长的一段时间里,数据中心都是英特尔关注的一个很大的领域。到目前为止,腾讯、百度、完美时空、网易等企业的数据中心已经引入了至强5500平台的服务器。

在当天的会议上,完美时空副总裁兼运维中心总经理刘航和媒体分享了升级至强5500平台服务器后的一些经验。由于网游行业的特殊性,完美时空对数据中心的要求非常苛刻,“我们希望通过提升性能功耗比来提高数据中心的计算密度,从而降低成本、优化游戏的运行效果。”刘航表示,他们的数据中心使用了基于至强5500平台的戴尔刀片服务器后,通过提升性能功耗比来提高数据中心的计算密度,从而达到了降低成本、同时优化游戏运行效果的目的。

为了更好地与互联网行业客户进行沟通,英特尔还成立了一个部门专做数据中心规划设计,并且免费为客户的数据中心升级提供服务支持。英特尔企业方案部中国大区技术部经理梁岩在接受本报记者采访时表示,英特尔认为未来在数据中心的规划建设中,除了CPU本身,一些先进的理念和技术一定要在设计时就采用,否则以后会有限制的地方。“这个部门能够让我们和互联网行业客户沟通得更完善和彻底。”

除了普通的数据中心领域以外,在高性能计算(HPC)领域,包括中国石化胜利油田物探研究院、中国科学院超级计算环境合肥分中心在内的大量高性能计算用户,都在第一时间部署了由至强 5500 智能服务器平台构建的高性能集群系统。

作为中国科学院超级计算环境合肥分中心项目负责人,中国科学院合肥物理科学研究院计算中心主任曾雉表示:“建立中国科学院超级计算环境是中国科学院‘十一五’信息化规划的重要内容,合肥分中心的目标是聚合计算能力达到12万亿次/秒,因此对于高性能计算有着极高的要求。基于英特尔至强5500处理器的浪潮NX7140N服务器能够提供强大的性能保障和智能的能耗控制,而它在我们数据中心的大量部署,终于让我们的超级计算中心得以建立在出色的计算平台之上。”

对话:至强5500助推智能计算发展

39-b10-1.jpg
专访嘉宾:完美时空副总裁兼运维中心总经理 刘航

至强5500有一个让我感兴趣的功能,就是Turbo Boost(智能加速技术),它能够自动管理服务器应用,能满足用户在服务器承载能力、功耗等各个方面的需求,这种智能计算对我们企业用户确实是很有用的。

电脑报:游戏企业部署的至强5500平台服务器主要用于公司业务的哪个方面?

刘航:其实从第三季度开始,我们采购的服务器全部是基于至强5500的,不管是内部研发测试用机还是外部的业务机。不过两者的需求不同,内部研发测试用机主要看重能耗,因为我们自己的IDC(互联网数据中心)通常会受到电能的限制,这不单是成本的问题,因为大厦就只供给这么多电,只能放100台服务器。而如果服务器采用低电压的CPU,或采用更好的节能技术,则可以放150台服务器,那么就能用于更多项目的研发。而外部用机如果是租赁服务器,则在能耗上不需要关心太多,只要单位面积的服务器能够提供更高的计算能力就行。

电脑报:你刚才谈到,使用至强5500平台的服务器后,IDC的功耗明显降低,能否针对统一管理方面具体谈一下服务器管理的问题?

刘航:Nehalem平台之前英特尔有一个开放的接口标准叫IPMI,在新一代Nehalem 推出后,英特尔整合起来进一步推出了DCMI,基于DCMI的接口能够对服务器分层,针对一个IDC或某些集群的机器,我们做一些开发,大部分互联网企业的运维平台都是自己做的,市面上很少有能维护几千上万台的机器又能满足自己应用的平台。有这样一个接口,第一,对服务器的温度、功耗、硬件的故障情况等,在第一时间能得到反馈。第二,基于接口进行批量处理,对我们来讲是简化管理的措施,如果按照传统理解的服务器,没有管理的接口,一家互联网公司管理几千上万台服务器是不可能的。

电脑报:实际上很多行业变化很快,游戏也是有生命周期的。你有没有遇到过这样的问题,比如原来单位面积的计算量不能满足需求时,不能说计算量一上来就新买一层楼放服务器,有没有考虑过用新的服务器替换掉旧的服务器,现在有没有相应的计划?

刘航:这个问题刚好是我前一段时间遇到的。我们在准备部署至强5500平台的服务器时,通过计算发现一个问题,现在IDC中有很多至强5400甚至更早的双核处理器平台的服务器。服务器托管有三类成本:第一类成本是服务器每个月的折旧成本,各家互联网企业的服务器有三年、四年、五年的折旧,略有区别;第二类成本是服务器机架的租用成本;第三是带宽成本,带宽成本是根据用户数量改变的,带宽成本越多我越高兴。服务器机架的租用成本是我最想省的,服务器机架租赁的费用远大于对服务器的投入,每个月付给IDC的钱很多。这里面也有很多历史原因,IDC(互联网数据中心)设计的能耗比偏低,电能不是给服务器用了,是给空调、UPS这些设备用了。

对于采用老的双核处理器和至强5400平台的服务器,一个机架只能放一台服务器。而对于采用至强5500平台的服务器,一个机架可放三台服务器。虽然买至强5500平台的服务器要花一笔钱,但服务器机架的租赁费用少得多了,带宽费用没变,这样算下来,总的开销还减少了。如果换下来的服务器没有用,放在仓库里闲着也没有意义。如果换下来的机器能运行一些低负载的应用,比如说运行一些网页游戏,或者能找到其他用途的话,换下来还是非常划算的,可以考虑把换下来的服务器放在公司做邮件、下载服务器等,现在的考虑是这样的。

电脑报:作为行业用户,你怎样看待智能计算这个概念?

刘航:对企业用户来讲,更重视的是实用,智能计算要为我们带来实际的好处。什么是智能呢?举一个例子,在个人电脑刚兴起的时候,很多硬件爱好者喜欢玩超频,给CPU加电压提高频率,本来是2.6GHz的,加电压后就超到3.2GHz,超频后功耗会提高,发热量会增加,一切需要用户手动操作,系统不能根据用户的需求自动超频,谈不上智能化。而至强5500有一个让我感兴趣的功能,就是Turbo Boost(智能加速),四个核用的时候开启,不用的时候就关掉。打个比方说,四个核跑8个线程,同样承载任务,一个线程承载500个玩家,一个线程承载200个玩家,希望承载500个玩家的内核频率高一点,至强5500可做到对负载比较高的核主动超频,不用的核就关掉,这样做就很实用,不需要用户花太多的心思管理,确实能够更好地满足用户在承载能力、功耗等各个方面的需求,这种智能计算对我们企业用户确实是很有用的。

电脑报:不同的网游同时在线的人数也不相同,你们有没有考虑应用一些虚拟化相关的技术?

刘航:有考虑过采用这方面的技术。现在还没有实际应用,内部在做一些测试。虚拟化技术对我们来讲确实可以节约成本,但是更关键的是用户体验。一项技术在内部应用成熟前,是不能盲目上马的,要谨慎地评估才可以上马,否则失败后用户会成为“牺牲品”,现在我们正在做服务器虚拟化方面的测试。