人类智慧的试金石 解读IBM超级电脑“沃森”

i企业

7-a8-1-1.jpg

IBM超级电脑“沃森(Watson)”在电视智力竞赛节目《危险边缘》上与两位人类冠军选手展开对决,一战成名。很多读者都很关心,“沃森”为啥这么厉害呢?它真的具有比拼人类的智力?

基于IBM Power 750服务器

据IBM资深系统架构师David Davidian透露,“沃森”就是一个基于IBM Power 750服务器的大规模并行计算系统,它可以兼容AIX软件系统以及Linux系统。读者要了解“沃森”,只需要先了解IBM Power 750,就能明白十之八九。IBM Power 750有何特点呢?

众所周知,Power 750服务器是一款单插槽到四插槽服务器,这款服务器通过Power7八核处理器模块支持最多32个内核。

从实际应用来看,IBM Power 750服务器旨在通过领先的性能,可选AIX或Linux操作系统,以及PowerVM虚拟化功能提供超越普通机型的业务价值。无论用户是需要一个可靠高效的服务器整合平台,还是需要一台多重应用的数据库服务器,Power 750服务器都能满足要求。并且IBM Power 750服务器还通过了能源之星认证(它是第一个通过该认证的RISC小型机系统),它采用了创新的技术,能使企业用户在竞争中展露锋芒。

从其硬件配置来看,在处理器方面,IBM Power 750最多支持4颗主频为3.0GHz/3.3GHz/3.55GHz的八核Power7处理器。每颗CPU均被封装在独立的处理器卡上,每个核心具有4MB L3缓存和256KB L2缓存。

在内存方面,Power 750的每块CPU卡上具有8个DIMM插槽,共支持32根1066MHz DDR3内存,内存最高支持512GB。不安装I/O扩展卡的Power 750内部可以安装8块SFF SAS机械硬盘或8块SFF SAS固态硬盘,最高提供2.4TB的内部存储容量,具备四个千兆或两个10Gbps的集成网络端口,并支持虚拟化功能。

而通过扩展卡,Power 750服务器提供了超过100个LAN端口,它最高支持576个硬盘驱动器,使存储容量可扩展超过240TB。从硬件配置来看,Power 750并非IBM的顶级系统,即使与Power 755、770和780相比,Power 750也只能算是Power7xx系列机型中的“入门”产品,其定位是以比较经济的价格来满足多种商业应用,如满足用户的虚拟化、数据库等方面的需求。

7-a8-1-2.jpg
IBM Power 750服务器的接口图

“沃森”并非顶尖高手

“沃森”由90台IBM Power 750服务器组成,它总共有16TB内存、4TB的集群存储容量,总共有360颗CPU共2880个Power7处理器内核,可以保证500Gbps的带宽吞吐量,其体积只有10台普通冰箱那么大。“沃森”采用的操作系统也是行业常见的Novell’s SUSE Linux Enterprise Server系统。从其配置上来看,它与我国知名的顶级超级电脑“天河一号A”(目前全球最强的计算机“天河一号A”由2048颗我国自主研发的飞腾FT-1000八核处理器、14336颗Intel Xeon X5670 2.93GHz六核处理器、7168块NVIDIA Tesla M2050高性能计算显卡组成)以及“走鹃”相比,集群性能只能算“小字辈”,难以进入世界高性能计算机100强之列。但通过挑战人类的智力,“沃森”的知名度远远超过目前世界HPC TOP500排行榜前10名的超级电脑。

在软件设计上,“沃森”更注重对智能计算、模拟人工智能的开发应用。它具备自己的Deep QA(深度开放域问答系统工程)智能运算系统,据国外媒体报道,该系统是由IBM以及全球范围内的8所知名大学共同研发出来的,该系统可以完成包含俚语、双关语在内的自然语言的识别和问答。并且该系统不需要连接互联网,也不需要通过互联网络进行搜索,仅靠内存庞大的资料库就能“智能”地对问题作出解答——其内部存储器存储了新闻、影视剧本、辞海、文选等庞大的数据资料。

在实际应用时,“沃森”内置的DeepQA系统可以读取数百万页文本数据,并利用深度自然语言处理技术产生候选答案,根据诸多不同标准分析哪个答案最适合,最后便可筛选还原成“答案”并输出为人类语言。并且,据IBM专家介绍,在智能运算技术的支撑下,“沃森”可以较好地识别英语语言中一些微妙的含义,分辨讽刺口吻、谜语、反语、俗语、构词断句等逻辑和线索。

“沃森”又迈出了一大步

目前的超级计算机能轻松击败国际象棋大师,但面对围棋高手还只能俯首称臣。从目前的情况来看,作为答题系统的“沃森”在人工智能方面也还难以称得上完美,它所能实现的人工智能分析能力尚处于低级水平,目前只能利用相对简单的语言体系——“英语”来回答问题,如要用在复杂的其他语言(如中文)上,则还有较长的路要走。“沃森”也难以具备人类天生具备的情感和“第六感”。“沃森”出现的意义在于,让人类对计算机智能化的关注度再度提升,让计算机智能化又向前迈出了实实在在的一步,让电脑在人工智能方面战胜人脑逐步变成可能,并让开发理解人类语言的电脑系统成为又一件极具挑战性并被强烈关注的事!

“沃森”还能用来干啥

随着IBM超级电脑“沃森”在2月14日~17日的人机大战中以绝对优势胜出,“沃森”一战成名、声名远播。“沃森”开辟了超级计算新时代,它显示了计算机能力的重大突破。它理解人类的自然语言,可建立和优化一个特定任务,并具有学习能力。沃森可以在3秒钟以内评估相当于数亿页的材料,比如书籍、报告、文章等。那么“沃森”除了能参加诸如《危险边缘》这种智力竞赛节目之外,还能用来干什么呢?

科学家们认为,“沃森”使用的技术在商业和社会领域都将有着广泛的实际应用,它可以在医学、法律、工程等几乎任何你能想象到的领域,提供即时咨询问答服务。比如,“沃森”能够在医疗卫生领域发挥作用,可帮助医生提高诊断病情的准确性;它还能改进在线自助咨询服务,为游客和居民提供相关城市的特定信息等。

医疗服务

比如在放射医疗方面,“沃森”的技术和IBM的其他分析技术相结合,有可能通过建立自动识别算法获得核磁共振成像,而且图像远比放射科医生以前可以看到的更精细。在心血管病治疗方面,“沃森”可用于指导心脏治疗,以避免医生犯该领域常见的错误,通过分析治疗数据和测试结果,自动寻找主要原因,如过度使用利尿剂等。

金融服务

“沃森”可以极大地提高金融服务公司的风险管理,并实时提供有关公司的战略决策和市场的变化。“沃森”还可以帮助投资者了解自己的投资组合,并决定作出何种投资。该系统可帮助投资者回答特定问题,如我应该如何处理刚收到的10000元奖金。

社会服务

“沃森”可以应用在社会服务领域,比如社会服务人员有时不能快速查清数百人的历次办证情况,而“沃森”有能力帮助工作者查明这些情况,同时也会回答诸如“在过去遇到过多少次这样的情况”的问题。 另外,为了获得新的建筑许可证,需要一个雇员处理大量的数据资料,往往达数千页,并且是写在一个非结构化(即不是机器可读)的表格里。“沃森”能够快速地阅读和理解那些成千上万页的资料,并为员工提供一个获得许可证的简要清单。以前工作可能需要一周,现在交给“沃森”只要一小时即可完成。

当然,“沃森”能做的还远不止这些,随着超级计算技术的快速发展,高性能计算机未来将在我们的生活中发挥重要作用。

延伸阅读:1997年国际象棋人机大战

●对决选手:卡斯帕罗夫

卡斯帕罗夫是俄罗斯国际象棋棋手,国际象棋特级大师,前国际象棋世界冠军。曾在1999年7月达到2851国际棋联国际等级分,在1985年至2006年间曾23次获得世界排名第一,曾11次取得国际象棋奥斯卡奖。从当年的“两卡争霸”,到与国际棋联的分分合合,再到轰动一时的人机大战,在国际象棋世界,卡斯帕罗夫创造了一个又一个神话,雄霸国际象棋棋坛15年,号称人类最聪明的人。

●对决选手:“深蓝”

“深蓝”(Deep Blue)是由IBM开发,专门用来分析国际象棋的超级电脑。“深蓝”并行计算系统基于RS/6000 SP,具备480颗特别制造的VLSI芯片。下棋程序以C语言写成,运行AIX操作系统。1997年版本的“深蓝”更看重如何发挥大规模并行计算技术的优势,拥有更高的计算能力,每秒可检查超过2亿步棋,是1996年版本的2倍。1997年6月,“深蓝”在世界HPC TOP500榜中排名第259位,计算能力为11.38GigaFlops(GigaFlops:每秒10亿次浮点运算)。

●大战回顾

最早进行人机大战的计算机是“深思”,它首战便击败了丹麦特级大师拉尔森,但在1989年与卡斯帕罗夫进行的“人机大战”中以0:2败北。随后,IBM便开发出了“深蓝”。

1996年2月10日,“深蓝”首次挑战国际象棋世界冠军卡斯帕罗夫,但以2∶4落败,比赛在2月17日结束。

其后研究小组对“深蓝”加以改良,1997年的“深蓝”可搜寻及估计随后的12步棋,而一名人类象棋好手大约可估计随后的10步棋。1997年5月,“深蓝”再度挑战卡斯帕罗夫,最终“深蓝”电脑以3.5:2.5(两胜三和一负)击败卡斯帕罗夫,并让卡斯帕罗夫于最后关键一局第19手弃子投降。“深蓝”成为首个在标准比赛时限内击败国际象棋世界冠军的电脑系统。

赛后卡斯帕罗夫并不服气:“我要声明,我的失败与科技无关,因为电脑的表现完全没有机械的惯性,我不相信有这样优越的电脑。”他认为电脑在棋局中可能有人类的帮助,因此要求重赛。但IBM拒绝了他,并让“深蓝”退役。此后,IBM科学家开始研究如何将智能计算知识应用到医药工程、金融分析等方面。