互联网之父钟情语义网

网络与通信

“语义网”的重要性在于,理解信息的含义将不再是人类才能做的事情,机器也同样可以做到。现在的信息都是为了给人们看的,如果要把这些信息经过机器的再处理,就必须先对它们进行加工,加工成机器可以理解的原始信息,这是相当麻烦的,而语义网建立起来以后,事情就会变得简单得多。
伯纳斯·李现为麻省理工学院(MIT)的万维网(W3C)协会的主席,他正致力于开发的新一代互联网叫做“语义网”(Semantic Web)。

早期发展

1968年,奎连(MR.Quillian)最早提出语义网表示法,创建解决记忆心理学模型;
1973年,西蒙(R.F.Simon)研究小组将语义网络用来表达自然语言;
直到现在,由伯纳斯·李牵头领军擎旗,语义网的发展整整35年。
就连伯纳斯·李本人也承认,实现语义网要比万维网来得慢。语义网,好比是数据库智能化、协调好的巨型大脑,可以解决各种难题。对“语义网”的解释,就是使机器做到人类才能做的事情。
语义网的飞跃发展主要得益于其应用之一:机器翻译(machine translation)。
70年代后期,语义网技术被广泛用在机器翻译中。首先通过分析源语歧义现象,依据平行的句法结构,等长的文本等是次要标准,然后借助语义数据库和比较词库进行消歧,使源语与目标语的语义一致,从而解决语义歧义问题,提高系统运行效率。
其实,语义网改变机器翻译历史进程作用也只是语义网应用的冰山一角,用伯纳斯·李的话来说,“机器翻译只是人们与语义网直接面对的一扇门,那门后将是无穷尽的数字财富。”

初现端倪

在语义网的构想里,网络可识别文件信息意义。例如:网页上的地方天气预报,用户一看就懂,可是机器并不知道在那么多的数字中,哪一个数字代表温度。语义网的含义就是在隐藏的编码中指明哪个数字代表温度,并且说明“温度”一词的含义。
“近10年来,研究人员一直都在考虑这类问题,现在我们才有可能把它变成现实。”伯纳斯·李说,“语义网上的数据是真正的可以被机器处理的数据,这就是令人兴奋的所在。”
就在评论家认为语义网面临永远不可能解决的技术障碍的同时,智能搜索引擎的出现使他们的顾虑化为无形。其中比较典型的例子是斯坦福大学博士生Larry·Page和Sergey·Brin设计的Google搜索引擎。该搜索引擎技术将语义网功能发挥出它最擅长的易用性和高相关性,采用互联网综合智能来决定网页的重要性,而非传统搜索中人为主观判断。
美国《Wired》杂志这样评价:“Google已成为用户的宠儿,因为它简单,且有效。”

改变未来?

虽然伯纳斯·李不遗余力地推广语义网,甚至有时歇斯底里地与不同意见者争论。持不同意见者这样形容他,“语义网已经成为他的人生目标,他在试图推翻自己的另一理论,很像抓着自己头发往上拎一样难”。
他的同事说,“这项工作具有相当大的挑战性,这样的网如果存在的话就再好不过了,但是首先,有一些真正困难的问题需要被解决。”
主要问题的是,随着系统中规则的变化,排列组合越来越多,计算机从互联网页面上数据做出推论所需要花费的时间就会急剧地增加。在数学界流传这样一个经典故事:一个推销人员确定一条穿过几个城市的最短路线,当只有极少的几个地方时,很快即可找出所有可行路线中最佳的一个。但当地点的数目变成仅仅15个城市时,可行路线将会增加为430亿条以上。同样的问题存在于利用计算机进行推断的情况,强力地搜索答案会导致陷入时间浪费的困境。
所要解决的问题是使机器获得对储存在网络空间的数据进行智能评估的能力,为互联网上杂乱而庞大的信息设计一种架构,使它们易于查找和利用。
即使技术问题可以解决,创建语义网的障碍仍然相当大。放在语义网开发者面前不可忽视的另一个问题是,语义网所带来的这些好处是否与付出的额外努力成正比,毕竟现在的Web已经非常的成功。

长路漫漫

在美国,作为自然语言机器理解程序的知识表示方法,后来成为计算机辅助教学系统(CAI)的重要知识表示结构,传统教学设计专家们对语义网也很赞赏,认为十分有助于学生建立记忆结构。在医学界,语义网技术已经被应用于描述医学术语,针对各种编码方案从不同角度和目标,语义网语言对复杂的医学文档进行描述。
另外,经过万维网协会和其他一些电脑组织推广,语义网初见成效。美国国防部高级研究计划局(DARPA)为语义网项目先后捐助了3500万美元,并为美国国防部开发了叫做DARPA代理标记语言(DARPA Agent Markup Language),这种基于语义网的语言允许用户往Web文件中加入其他类型数据,并把它连接到信息实体上。
随着语义网基础结构的工具的出现,惠普、诺基亚等公司也加入语义网应用程序的开发。
“这是一项很具挑战性,十分困难而又具有重大意义的工作。”伯纳斯·李说,“很想尝试打败自己的感觉。”