HPC走向小型化,个人拥有HPC不是梦

行业观察

在计算机“摩尔定律”的推动下,计算机的硬件性能越来越强。而高性能计算机(HPC)在这种技术浪潮的推动下,也正在悄悄地发生改变,一方面位于数据中心的高性能计算机正纷纷迈入每秒千万亿次的级别,另一方面,针对普通商业用户的桌面高性能计算机也纷纷抢滩登陆。普通用户也能拥有高性能计算机?对,这不是梦,这已变成现实。

高性能计算两极分化:数据中心HPC和桌面HPC

什么是HPC呢?通常来看,它有两层含义:一是指高性能计算(High Performance Computing),是高性能计算的英文简称,二是指高性能计算机(High Performance Computer),是高性能计算机的英文简称。HPC是一个领域里的两种不同指向的概念,适用于不同的场合。

●传统的数据中心HPC

从技术特点来看,高性能计算机就是我们常说的超级计算机(Super Computer),它多以集群形式出现,它可通过各种互联技术将多个计算机系统联系在一起,利用所有被连接系统的综合计算能力来处理大型计算问题,所以又通常被称为高性能计算集群(High Performance Computing Cluster,简称HPC Cluster)。高性能计算集群能够实现单个高端计算机系统不能满足需求的计算,所以它主要被用来解决大规模科学计算、存储和处理海量数据,被应用于天气预测、气候研究、运算化学、分子模型、物理模拟、密码分析等等领域。传统意义上的高性能计算机通常体积很大,常常安装于专门的数据中心,需要专人维护管理,因此也被称作数据中心HPC。

当然,传统高性能计算机的定位让它的身价不菲,以IBM为英国气象局新开发的一款高性能计算机为例,它的基础造价为3000万英镑,在峰值状态下每秒可进行一千万亿次运算,运算能力比10万台个人计算机的总和还强大,放在比两个足球场还大的大厅里,运行起来需要1.2兆瓦的电量,其主要用途为向一个由400位科学家组成的专家小组提供气象信息分析服务,可提高天气预报的质量,甚至可以预测全球气候变暖的趋势,预测台风和飓风等极端天气事件,由此挽救生命。

●面向个人用户的桌面HPC

而普通企业甚至个人用户要想拥有数据中心HPC无疑于痴人说梦,如何让高性能计算机走向普及应用,成为众多企业甚至有较高需求的个人用户关注的焦点。为此,近几年来已有多家服务器企业试水小型化高性能计算机系统,很多公司都推出了“桌面超级计算机”计划,曙光公司更是明确提出了PHPC(Personal High Performance Computer,个人高性能计算机)的概念。

从产品定位来看,桌面HPC的定位高于顶级工作站和普通服务器,但明显低于数据中心HPC。桌面HPC的出现一举改变了传统高性能计算机体积大、重量大、功耗大、不易使用,同时价格非常昂贵的弊端,它作为高性能计算机的普及化产品,除具有超强的计算能力外,还具有体积小、噪音小、易用等特点,可以脱离数据中心机房独立使用,这样桌面HPC就可以直接放到用户的办公桌上,或搁在你的工作台边,普通用户也能用上高性能计算机了。

从实际的产品来看,桌面HPC或小型化HPC的运算能力能轻松地达到每秒万亿次级别,其性能优于一般的小型机,远高于顶级工作站和普通塔式服务器,并且可以比肩普通服务器集群,完全可以满足中小企业对高端运算的需求。并且,桌面HPC体积小巧,可以轻松放置在办公室中,不需要专用电源,可以直接使用普通交流电源,价格在数万元到数十万元之间,中小企业完全可以接受。

26-企业1-1.jpg
数据中心HPC的维护工作量不容小视

桌面HPC究竟有多快

Linpack是线性系统软件包(Linear system package) 的缩写,现在Linpack已成为最流行的用于测试计算机系统浮点运算性能的基准测试程序,通过利用高斯消元法求解一元N次稠密线性代数方程组的测试,评价计算机的浮点运算性能。Linpack实际上有三个版本,分别是Linpack 100、Linpack 1000以及High Performance Linpack。Linpack 100是最早的版本,High Performance Linpack通常也被简称为HPL,不允许修改源代码,但是可以通过Hpl.dat配置文件进行设定,修改问题规模、CPU数量以及通信、问题分块大小等,HPL被用作高性能计算机的基准测试程序。目前普通PC在业余状况下使用Superπ测试浮点运算性能,而在专业的场合下也使用HPL测试浮点运算性能。

众所周知,评价计算机性能的一个重要指标就是计算峰值,它是指计算机每秒钟能完成的浮点计算的最大次数,它包含理论浮点运算峰值和实测浮点运算峰值。理论浮点运算峰值是指计算机理论上能达到的每秒钟可完成浮点计算的最大次数,它主要是由CPU的主频和核心数目决定。而实测浮点运算峰值是指Linpack测试值,即在机器上运行Linpack基准测试程序,通过各种调优方法得到的最优测试结果。实际上,在实际应用中计算机几乎不可能达到实测浮点运算峰值,更不用说达到理论浮点运算峰值了,这两个值只是作为衡量计算机性能的指标,用来表明计算机处理数据能力的强弱。在没有更科学的评判方法出现之前,Linpack测试结果被专业机构广泛采用。

在Linpack基准测试中,还包含单精度(32bit)浮点运算性能和双精度(64bit)浮点运算性能测试,目前来看双精度浮点运算性能测试是发展趋势。在科学计算中,大部分程序都会用到双精度浮点运算,而GPU相对CPU在处理核心数量上的巨大优势,使GPU非常适合用来做这种并行计算处理。目前GPU纷纷在这方面获得突破,例如与最新的四核CPU相比,NVIDIA Tesla C2050与C2070计算处理器以十分之一的成本和二十分之一的功耗就实现了同等的计算性能。每颗GPU的单精度峰值运算性能超过1Teraflop/s(每秒万亿次),每颗GPU最高可实现515Gigaflop/s(每秒10亿次)双精度峰值运算性能。与一个小型服务器集群相比,配备多颗GPU的单台个人HPC能够更快地解决大型计算难题。

全球HPC TOP500排行榜是目前高性能计算机发展的航标,它根据Linpack实测值来判断整机系统性能的高低,包含单精度浮点运算性能、双精度浮点运算性能测试。但从目前来看,HPC TOP500排行榜一般都按照双精度浮点运算性能来比较排序,例如,按单精度性能计算,“天河一号”的峰值单精度浮点运算性能高达每秒1206万亿次,但Linpack双精度浮点运算测试性能却只有每秒560.3万亿次。从最新的全球HPC TOP500榜来看,HPC的Linpack运算能力达到每秒24万亿次,就能进入全球HPC 500强。最新的桌面HPC单机已可实现每秒数千亿次或上万亿次的Linpack运算能力,而目前市面上主流配置的台式电脑最多能实现每秒数百亿次的Linpack运算能力,也就是说,一台桌面HPC的计算能力相当于50~200台主流桌面PC的计算能力。

市场上的典型桌面HPC扫描

伴随着计算机的CPU/GPU性能的不断提升,出现使用上类似于PC、性能上接近服务器集群的小型化HPC已不再是梦。而口说无凭,目前市场上究竟有哪些典型的桌面HPC产品呢?背后推动它们的厂商和技术又有哪些呢?

●曙光的PHPC

曙光公司在2008年便已正式推出个人高性能计算机——曙光PHPC100,它是这方面的代表产品之一。该机采用全模块化设计和背板设计,共有5个计算模块(1个模块为计算兼管理模块,其余4个为计算模块),10颗双核/四核处理器,每秒浮点运算性能为3000亿~4000亿次,功耗在1500W以内,重量小于60kg,在机箱下面有四个轮子,凭一个人的力量就能轻松移动,可以通过普通的插座供电。其运行噪音低于48dB,适合办公室环境使用,且不需要专业的机房和专门的空调进行散热。

曙光PHPC100个人高性能计算机通过对各功能模块的整合,显著减少了连接线缆的数量,有效降低了各系统连接和集成的复杂度,仅冗余电源、KVM和网络三项,就节省了86%的线缆,将系统的稳定性大大提高。而通过选用由微软研发的WCCS集群操作系统,可使普通用户很快进行熟练性的操作。并且据曙光介绍,曙光已计划在近期推出第二代PHPC产品,相信其性价比会有进一步的提升。

●IBM的BladeCenter S刀片服务器系统

而IBM的BladeCenter S刀片服务器系统也是这方面的代表产品,它能很好地兼顾商用和小型化HPC环境的双重需求。众所周知,S系列是IBM第一款专门针对办公室和分布式企业环境而设计的BladeCenter架构,它具有六个服务器托架,在7U高的机箱中可整合服务器、网络和存储器等相关设备,支持各种系统及基于英特尔、AMD、Power等系列处理器的刀片,并且允许混插;支持多种不同的光纤网络;支持SAS和SATA两种类型的硬盘。并且,该系统首次采用了与家用电脑类似的配置模式,可最大限度地减小用户管理难度;它标配一个智能高级管理模块,可提高管理员的效率。

26-企业aaa.jpg
曙光PHPC100的正面图

小提示:U是表示机架式服务器厚度尺寸的单位,是Unit的缩略语,详细的尺寸由作为业界团体的美国电子工业协会(EIA)所规定。1U就是4.445cm,2U则是1U的两倍,为8.89cm,依此类推。

IBM BladeCenter S刀片服务器系统使用标准的办公室电源,允许用户在数据中心之外构建自己的高性能计算机系统,它既能很容易地与常用的商务应用,如杀毒软件/防火墙、IP语音、电子邮件、协同软件、备份与恢复软件以及文件和打印应用等相集成,从而构成一个小型的“数据中心”,也可着重强化高性能计算应用,成为一个小型化的HPC,广泛满足中小企业用户对天气预报、地震处理、分子力学、物理模拟和计算流体力学等高负荷工作的需求,可让拥有20~50台服务器的中型企业减少80%的服务器数量。

●Cray的CX1异构系统

而超级计算机领域的著名厂商Cray公司则在微软、Intel、NVIDIA等厂商的支持下推出了Cray CX1桌面超级计算机。它采用8U刀片式设计,集计算、存储和虚拟化技术为一体,内部可选择安装1U计算节点或虚拟化节点以及2U到3U的存储节点,每个节点可搭载多颗Intel Xeon系列多核处理器,操作系统可选Windows HPC Server 2008或Red Hat Linux Enterprise v5。机箱配置1600W冗余电源,整机采用静音设计,方便用户在普通房间中使用。

而通过整合NVIDIA的Tesla计算处理器或Quadro GPU,Cray CX1便可成为一台浮点性能更强的个人高性能计算机——每颗Tesla处理器均具备数以百计的处理核心,可实现近1Teraflop/s(每秒万亿次)的峰值计算性能,Cray CX1桌面型系统配备4颗Tesla处理器,便可达到4Teraflop/s的浮点运算性能。CX1的起步售价约为25000美元,如果配足16颗CPU,价格则为60000美元左右。这是Cray公司迄今为止提供的最“实惠”的桌面HPC,可很好地满足对高性能计算有需求的金融服务、石油天然气、生命科学、政府部门以及学术领域的用户的需求。

●其他的桌面HPC

除了以上介绍的典型产品,在桌面HPC领域还有很多前沿厂商推出了相关产品。如:泰安推出的“Typhoon(台风)”个人超级计算机;AMD Office Blade高性能静音刀片服务器,可做到10个双CPU刀片同时工作在50dB下;浪潮“倚天”万亿次桌面超级计算机,其体积与普通台式机的主机箱相仿,最高计算能力可达4 Teraflop/s,相当于40台服务器的计算能力,售价5万元;AMAX推出的4Teraflop/s的 ServMax PSC-2n个人超级计算机,它采用了双Intel Xeon 5500系列处理器和多达4个的NVIDIA Tesla GPU,共同组成了小型的大规模并行超级计算机;我国首台采用国产高性能通用处理器龙芯3A以及其他国产器件、设备和技术的万亿次高性能计算机KD-60。这些桌面HPC都是小型化高性能计算机的典型代表产品。

另外,在去年英特尔和中科院计算所还联合推出了个人高性能工作站(PHPW,Personal High Performance Workstation)原型机,它可提供超过每秒万亿次的计算性能。从本质上说,个人高性能工作站属于桌面HPC的一种,它们之间的区别不大,只是个人高性能工作站在某些设计上作了一些改进,比如更适合办公环境,更安静,性能也更好,采用独特的横向散热风道设计,使用以太网普通网卡,但可以获得更高的性能,整个机器的Linpack效率可以达到80%以上。

从市场上的这些小型化高性能计算机还可以发现,桌面HPC存在两种发展方向:一种是纯X86架构,表现为刀片服务器或小规模的塔式集群,这方面的典型代表就是曙光PHPC100和IBM的BladeCenter S刀片服务器系统;而另一种则是CPU+GPU的混合架构(也称异构系统),这方面的典型代表就是Cray的CX1异构系统和浪潮“倚天”万亿次桌面超级计算机。随着这类桌面HPC产品纷纷涌现,标志着高性能计算的门槛正逐步降低,在新一代高性能CPU/GPU的支撑下,新的桌面超级计算机、小型化高性能计算机细分市场正在形成。

26-企业1-3.jpg
只需要一个不大的塔式机柜,HPC便能实现超强的计算性能
26-企业1-4.jpg
英特尔和中科院计算所联合推出的个人高性能工作站

桌面HPC成为行业用户新的解决之道

传统的高性能计算机或超级计算机是计算机中运算速度最快、存储容量最大的一类计算机,多用于国家高科技领域和尖端技术研究,是国家科技发展水平和综合国力的重要标志。除少数机型可开放给各界有需要的团体申请使用外,绝大多数此类机型都是供各国核心机构使用的重要机型,除了专门机构,普通企业用户很难一睹芳容。

而随着以CPU、GPU、内存、硬盘为代表的电脑硬件性能不断提升,让高性能计算机的性能不断倍增,研制难度反而在不断降低。中国第一台被命名为“银河”的每秒运算上亿次的巨型电子计算机历经5年才在1983年被国防科技大学研制成功。1999年国家并行计算机工程技术研究中心研制的用于国家气象中心的神威I计算机,峰值运算速度为每秒3840亿次,而2009年10月29日,中国首台千万亿次超级计算机“天河一号”只用了一年多便研制成功。从每秒亿次的HPC到每秒千亿次的HPC研制历经了15年,而从每秒千亿次的HPC到每秒千万亿次的HPC研制只用了10年。并且我们可以看到,在计算机性能的不断提升下,如今的小型化HPC/PHPC/桌面HPC在体积大幅度缩小的情况下,已完全有能力媲美5~10年前的大型超级计算机系统,这让小型化HPC全面走进商用并具备较大的市场成为可能。

而随着小型化HPC的普遍出现,其性能也会日益增强,将更好地为生命科学、地球物理科学、工程学、三维渲染、分子生物学、医学诊断、电子设计自动化、气象预报、公务应用、游戏影视虚拟、可视化、虚拟化、金融建模以及石油和天然气等领域的用户提供服务。在现实生活中,许多科学研究和商业企业的计算方面的具体问题都可轻松地通过小型化HPC系统来解决,如天气预报、制药企业的药理分析、科研人员的大型科学计算问题、石油勘探中对石油储量的分析、航空航天企业的设计和模拟、化工企业中对分子结构的分析计算、制造业中的CAD/CAM系统和模拟试验分析、银行和金融业对社会经济情况的分析、生物/生命科学中对生物分子的研究和基因工程计算等等。以来自北美服务器厂商AMAX推出的最新系统ServMax Xn-4101G为例,它在单一系统中整合了8颗Tesla通用处理器,每台4U服务器可提供每秒高达8万亿次浮点计算的性能,这样的系统对于有高性能计算需求的成长型企业来说,显然有强烈的吸引力。

26-2-b1.jpg

编后>>

“旧时王谢堂前燕,飞入寻常百姓家。”小型化HPC的出现,曾经高不可攀的超级计算机正成为很多企业重点追逐的“猎物”。而随着计算机硬件性能的不断提升、制造工艺的不断进步和集成度的不断拔高,小型化HPC的性能将变得越来越强大,其市场潜力也将逐步被挖掘出来。而它具备的兼容性更强、更易维护、更易升级、更易使用的特点,也必将吸引更多企业用户的目光,让众多的新兴科技企业也能在大型、密集、高性能计算方面一展身手,对推动整个业界计算水平的向前跃进大有裨益,对推动全球高性能计算机业务向前发展具有极其重要的战略意义。未来的企业应用领域,也必将会有小型化HPC的一席之地。