开放Office格式起纷争

新软件

在开发源码和文件格式方面,微软的保守恐怕再无出其右者。即使在各方压力下,微软也仅仅是有条件地向一些国家开放了部分Windows源码。而对于撑起微软半壁江山的Office软件,它的文件格式却一直被微软死死捂着。

近日,微软终于低头,宣称将开放下一代Office文件格式。

事件:微软公司将拟在下一代Office中采用的Office Open XML文件格式提交给国际标准组织——欧洲计算机制造商协会(ECMA International),期望它能成为ECMA认可的开放式通用文件格式。以此为台阶,微软公司还希望Office Open XML能成为国际标准化组织ISO的推荐标准。

开了一条缝的门

撑起微软业绩半壁江山的Office,早已成为世界上使用最广的办公软件,然而其文件格式始终秘而不宣,使得Office文件格式无法实现同其他格式的自由转换,或被第三方软件完全支持,信息的交流便经常不可避免地遇到梗阻。

其它软件要与Office实现互操作很不方便,要么使用OLE技术从外部调用Office实现数据的共享,要么花费大量人力物力逆向分析Office文件格式,实现与Office的部分兼容。由于Office文件格式非常复杂且在不断变化,以金山公司的雄厚实力,也只能做到文字和表格格式等方面的兼容,足见Office文件格式保护之好和破解之难。

现在Office文件格式终于要成为开放的标准了,那些曾为此苦恼的用户将露出欢颜。在高兴之余,我们对微软的老辣或“奸滑”还是颇有微词,因为它这回开放的只是Office Open XML格式,对以前专有的Office文件格式丝毫不涉及,而XML格式本来就是通用标准,对XML格式的分析也较易进行,因此微软此次的开放,亦如以往一样,大有折扣。说到底,这扇从没开启过的铁门,现在不过是开了一条缝而已。

Office格式之争

微软这次肯公开Office Open XML文件格式,美国马萨诸塞州政府关于从2007年开始政府雇员所有建立和保存的电子文档必须使用开放文档格式的决定,无疑是一针大剂量的催化剂,而且越来越多政府部门趋向于采购开放文档格式的办公软件。

当以往毫无悬念的胜出如今变得模棱两可甚至因设限而连场也进不了时,封闭的Office文件格式就成了微软在政府采购中的最大绊脚石,尽管封闭的Office文件格式曾给微软带来了巨大的“垄断”利润。

当有了别的可以依赖的选择时,对共享性和安全性要求很高的政府部门再也不能容忍黑箱似的Office便在意料之中了,而政府部门偏偏是Office软件的最大采购者,也难怪一个州政府的一纸决定就会令微软慌了手脚,因为更可怕的是这之后的连锁反应。

而令用户有底气弃Office而去的就是IBM等力推的OpenDocument标准,它同Office Open XML一样,也是基于XML格式。它是一种真正开放的文件格式,得到了许多软件开发商、开源组织、政府机构、图书馆的支持,其中就包括向Office说不的马萨诸塞州政府。

小资料:OpenDocument

OpenDocument是OASIS Open Document Format for Office Applications的简称,是一种适合办公应用的标准化的基于XML的文件格式规范,为OASIS所有,但是可以免费使用,适用于文本、电子表格、图表和图形文档。当前版本为1.0。

微软自然无法容忍OpenDocument坐大,让它动摇Office的地位,何况OpenDocument背后的IBM等亦非等闲之辈,力扶Linux和Firefox以压Windows和IE就是前鉴。于是,开放Office Open XML文件格式以抗衡OpenDocument便成了微软不得已的选择。

不过,Office Open XML文件格式虽然向ECMA提交了,但要成为ECMA标准却并非易事,因为它遭到了IBM等的激烈反对,而且许多用户和组织都对Office Open XML文件格式成为标准感到忧虑,认为这样很可能使OpenDocument再度边缘化,令Office重又一家独大。看来,经过痛苦的挣扎豁出去要开放一把,也还有许多人不买账,微软心里恐怕难免生出今夕何夕之感。

谁笑到最后

开放Office文件格式,微软表面看似吃了亏,其实并非如此。一方面Office Open XML是下一代Office采用的文件格式,对现有的Office并无影响。另一方面,微软将保留Office Open XML的许多知识产权,用户使用它还须获得授权。而且微软历来喜欢扩充标准,估计在下一代Office中Office Open XML标准至多是个基本集,大量扩充不可避免,而这些扩充又会使本来透明的格式再次变成雾中之花。何况,借开放以安抚政府用户,借格式以回击对手攻击,实在是费力不多却收获颇丰的一箭多雕之策。

对用户而言,开放的Office文件格式使他们可以自由地交换文档,而不必像以往那样须在每台电脑上安装Office软件。那些被微软冷落的Linux用户,也可以借助支持开放格式的工具阅读和编辑Office文档了。而政府部门和公司再不会为公众和客户提交的各种格式文档的转换而烦恼,效率自然会大大提高。

亦如Flash格式的开放一样,Office文件格式的开放也会使第三方软件商获益。可以预见,一向冷落的Office周边软件将迎来春天,而包括众多应用软件商、系统集成商也将从Office文件格式的开放中受益。

即使对OpenDocument标准,有Office Open XML这个竞争对手也不完全是坏事,因为当微软不得不正视你时,则意味着你的力量已足以动摇软件帝国的根基。

常见的开放文件格式

PDF:PDF是Adobe公司开发的电子文件格式。这种文件格式可应用于Windows、Unix、Mac OS等所有操作系统中。这一特点使它成为在因特网上进行电子文档发行和数字化信息传播的理想文档格式。PDF格式文件目前已成为数字化信息事实上的一个工业标准,许多软件都能很好地支持PDF格式。

SWF:SWF是目前主流的网络动画文件格式,由Flash或Flash辅助软件制作和生成。其低版本文件格式由MacroMedia公司公开,导致大量Flash辅助软件的出现,也使许多动画或视频制作软件可以输出SWF格式,促成SWF成为最流行的网络动画标准。

MP3:MP3是目前使用最为广泛的有损压缩数字音频格式。它的全称是MPEG Audio Layer-3,由德国夫朗和费研究院和法国汤姆生公司合作开发,并被Moving Picture Experts Group采纳为标准。MP3标准定义较为宽松,后来许多公司在此基础上进行了改进,使编码质量和效率有了进一步提高,产生了许多不同的编解码算法。

JPEG:JPEG是最常使用的图像文件格式,尤其在数字时代,它几乎是所有数码产品的标准图像文件格式。JPEG由Joint Photographic Experts Group开发,采用有损压缩算法,压缩比较大而画质下降和细节损失却不明显。它被几乎所有的多媒体编辑和播放软件所支持。

大话文件格式

理解文件格式

电脑中的信息一般以文件的形式进行保存,而为了便于编辑、查询、调用、存储、管理,信息在文件中的存放方式就必须有一定讲究,需要大量定义内容形态或属性的辅助性信息,包括对内容进行加工的算法,甚至是整个编辑环境都得加以保存,才能保证信息的完备性。而在文件中如何组织和存放这些庞杂的信息,就形成了文件格式。

以大家熟悉的Word文件格式DOC为例,它有一个很大的文件头,里面保存了编辑文档时Word的各种参数,文档的各种属性,以及文档所有人的私有信息等,几乎涉及到编辑环境的每一个细节,这也是一个字符的DOC文件也有几十KB大小的原因。文件头后面就是内容部分,由于Word可定义的字、段、页属性非常丰富,因此内容部分也极其复杂。

随着Word的不断升级,不可避免的DOC文件格式会更加复杂,其中包含的专利技术和独特算法也会越来越多,因此,如果微软不公开DOC文件格式细节的话,要彻底弄清DOC文件中每个字节代表什么,以及字节与字节间的关联,几乎是不可完成的任务。何况DOC文件格式随着Word的升级也在不断更新,要及时跟进亦是万难之事,也许微软小小的一个手脚,即可令破解者晕头转向。

开放是一种趋势

理论上,任何一个软件都可以定义其专有的文件格式。假如这些格式文件并不用来交流或共享,倒也无大碍,否则就会产生许多麻烦。解决的办法无外乎如下几种,一是由文件格式定义者公开文件格式,使另外的软件可以通过编程实现对它的兼容。不过由于牵涉到文件格式外的诸多因素,如专利和市场之类,肯公开专有格式的不多;二是虽然不公开文件格式,但提供操作这些文件格式的程序接口。这种方式在音视频格式中较为多见,其多以编码器和解码器的形式出现,如RM/RMVB等;三是采用标准化组织制定或推荐的标准文件格式,如JPEG图像格式,MPEG1/MPEG2视频格式,MP3音频格式等,就是公开的标准,几乎所有的相关的软件都提供了对它们的支持。

通过网络、技术文档等方式公开了所有细节,或是提交标准化组织成为标准,或是第三方完全破译并公之于众的文件格式,即为开放文件格式。尽管绝大多数开放文件格式可以自由使用,但并不意味着完全免费,一些专利还必须付费。就像DVD是一种公开标准,但中国厂商还得向一些拥有专利的厂商交专利费一样。

不过,开放文件格式极大地方便了信息的交流和共享,特别是在网络时代,开放的重要性越发显得突出,而那些把持文件格式不撒手的厂商将承受越来越大的压力。