网上有种新语言

Author: 白焕银 Date: 1999年 第29期 09版

  我们一直使用的HTML语言,由于它不易扩展,已不能适应网络发展的需要。为了解决这些问题,如今推出了一种新的WEB创作语言XML。而且已经有了众多的软件支持它,也许在不久的将来它会成为Internet上唯一的语言。
  XML称为可延伸的标记语言,事实上它并不是一种真正意义上的标记语言,而是一种允许用户对自己的标记语言进行定义的源语言。如果说,HTML是一个描述系统,而XML则是用来定义这些描述系统的系统。使用XML可以定义出像HTML这样的系统。
  它与HTML要达到的目标和实现的手法是不同的。与HTML相比,XML有三大特点:
  1.WEB作者能够任意定义新的标记和属性名。
  2.文档结构能被嵌套到任意复杂的层次上。
  3.任何XML文档都能包含它的语法的描述,以便应用程序使用,但是需要进行结构的有效性检验。一个合法的XML文档也就是整个文件体系被适当定义和组织的文档。
#1  如何设置服务器以便使其支持XML页面?
  现在的免费WEB服务器端的软件主要有三种:APACHE,Microsoft的IIS以及Netscape的ENTERPRISE SERVER,后两种是运行于Windows平台上的,APACHE运行于UNIX平台。APACHE是全免费的,而且市场占有率最高,达到50%以上。如果你使用的是APACHE 1.3.4, 那么无需任何配置,XML使用的mime协议已经在默认的方式下配置好了。如果是早期的版本,必须进行服务器的配置,编辑mime类型文件并且加入一行:text/ xml xml,然后重新启动服务器即可。另两种类型的服务器加入mime协议类型的方式稍有不同。
#1  如何写作XML的页面?
  一个XML文档,由XML主文件(文件扩展名为XML)以及一些辅助文件组成。根据作者使用技术的不同,辅助文档的数目和文件类型也不相同。
  如果用户使用了自定义标记,那么必须有一个机制来确保用户定义的标记语法正确。过去是使用DTD文件(扩展名为DTD)来检验文档语法的正确性。现在DTD技术已经过时,最新的校验技术是NAME SPACES技术,NAME SPACES技术的语法是符合XML标准的,微软称自己的XML文档有效性检验技术为XML SCHEMAS。
  XML文档的数据和显示方法是分别存放的,XML文件内只有数据。它的显示样式以及如何显示需要另外的机制来完成,如果使用JAVA脚本来显示,那么不需要另外的文件,如果使用XSL技术来显示,那么必须还要有一个扩展名为XSL的文件来控制XML文档的显示。
  书写符合XML要求的页面,首先要确定你是使用已有的DTD,还是自己创建一套。如果使用已有的,最好的候选方案是W3C定义的“XHTML 1.0”标准。可到以下站点查询:http://www.w3.org/TR/xhtml1/
  无论如何你都要自己书写一些文本,选择一个普通的文本编辑器即可。如果要想让文本编辑器能够给你一些帮助,那么可以选择一个专门用来书写XML文档的编辑器,首选是Microsoft的Word 2000,微软开发它的目的之一就是让它成为下一代书写XML文档的主要编辑器。
#1  如何上传到WEB服务器?
  因为XML文档也是基于文本的格式,它能够使用与HTML同样的方式上传到服务器。
#1  如何使用浏览器浏览XML页面?
  微软作为W3C的成员之一,也在积极推进XML技术的发展。它的最新浏览器IE 5.0,内嵌了XML功能,走在了其他浏览器的前面。迄今为止IE5.0是唯一对XML支持最多的浏览器,它内置的解析器(PARSER)能够从XML文档中抽取XML的对象,从而产生一个对象树,建立一个文档对象模型(DOM),最后使用XSL或者CSS,将XML文档以文档定义的方式呈现给浏览者。因此,使用微软的IE5.0可以直接浏览XML页面,并且不需要任何设置。
  作为最早推出浏览器的Netscape公司,其Netscape  Navigator 5.0在1999年7月发行BETA版。5.0版的核心引擎称为Gecko,据说也全面支持CSS和XML文档。
  蓝色巨人IBM是最早开发SGML语言的公司,XML是SGML的后辈子孙,对于自己产品的后续发展IBM当然不会弃之不管。IBM推出了一种称为XML ENABLE的软件,它在XML服务器和用户的浏览器之间起到转换的作用,将XML标记数据转换为HTML形式,对于不同的浏览器返回适合浏览器显示的数据。这对于使用的浏览器不支持XML技术的用户不啻是一大福音。如果查找关于XML ENABLE的相关信息,可到以下站点:
  http://www.software.ibm.com/xml/education/client/client.html。
#1  中文XML
  由于XML产生之初主要针对英文,没有考虑其他国家的文字,尤其是远离美国的亚洲地区。最近XML的管理机构宣布字体的支持采用UNICODE编码。UNICODE是一个包含全世界所有文字的大字符集,当然也包括中文。它采用了ISO 10646字符集,向其中加入包括亚洲文字的许多其他信息。UNICODE包括了GB2312、BIG5中所有的字。
  如果用户使用的软件支持ISO 10646字符集,那么它一定可以利用XML技术处理中文信息,但是软件内部到底有没有设置XML功能那就要咨询软件开发者了。由于XML的应用刚刚起步,所以目前绝大多数软件都没有针对中文进行严格的测试。大多数软件的XML支持都是隐蔽在系统内部的,也许你现在用的软件就支持XML呢,不信?用过IE 4.0吧,它的频道功能就是XML的一个典型应用。
#1    背景
    从1989年欧洲粒子物理实验室(CERN)的科学家Tim Berners-Lee提出Web的概念开始,Web已经不知不觉走过了十个春秋。在它即将迈入第二个十年的时候,人们有充分的理由关注Web未来的发展。在今后的十年中,技术将如何再造Web? Web的未来之路在何方?
    最近举行的第八届国际万维网大会(WWW8)对这些问题作出了回答。这次会议于5月11日到14日在加拿大著名的多伦多会议中心召开,吸引了来自世界各国的1200与会者。WWW8回顾了Web过去十年的发展历程,讨论了Web未来十年发展趋势和各种最新的技术标准。会议的议题十分广泛,几乎涉及了当今和未来Web技术发展的方方面面,包括XML、RDF、XHTML、DOM、DOM2、XSL、CSS1、CSS2、CSS3、CSS-OM、SMIL、XMLNews、UIML、XPages、可缩放向量图形、查询检索技术、多媒介等。值得注意的是,Tim Berners-Lee在会上还提出了“语义Web”(Semantic Web)的新概念,他用这个词来描述未来的Web。在为期四天的会议中,人们讨论得最多的话题是XML,因为他们深信,浮现中的XML将是Web光辉灿烂的未来。
    因为XML的精髓恰恰就是“语义Web”中的“语义”。