对多种文档标准的需求

权衡实际现实和潜在利益

关于标准化文档格式的讨论涉及很多方面。要花费一些精力才能找出这些重要的问题,以了解它们是对文档格式的影响以及可以对它们采取的解决方法。其中一些方面包括:

  • 自由选择最适合手边任务需求的格式
  • 许多应用程序和系统可轻松交换的文档格式
  • 不依赖于特定应用程序、供应商或平台来自由交换文档
  • 与现有文档的最大兼容性
  • 为记录管理和归档目的而保留文档
  • 支持广泛的语言和帮助技术需求的文档格式
  • 解决大量的各种软件应用程序、用途和功能
  • 保护文档中存储的信息不会被用到不希望被用到的地方

这些目标反映了组织对软件应用程序的独立性、可选择性、创新性和自由性的强烈渴求。它还反映了组织从现有软件中获取更多利益和更好地集成桌面与后台系统的强烈愿望。虽然还有许多值得考虑的因素,但这里列出的内容已经充分了说明了组织在理解标准化文档格式对其计算生态系统的意义时遇到的巨大困难。

许多这些目标还可能会发生冲突。例如,适合归档的文档格式是否需要保护其内容不被用到不希望用到的地方?为了与其他应用程序和系统集成,它是否还应当支持实时更新和信息交换?从表面看来,文档格式标准的许多有价值目标反映了软件使用的多样性。一种格式似乎不能合理适应所有这些目标。

公共和私人部门机构中的用户既想从标准化的开放文件格式中获益,又想保留使用现有文档内容的能力。由于向后兼容性在任何技术领域中都是必需的功能,Microsoft 与业内的其他公司协作,设计并编写了 Ecma Office Open XML 标准 ("Open XML") 以实现这一目标。

Open Document Format (ODF)

在 2006 年,国际标准组织 (ISO) 批准了另一种文档格式标准。Open Document Format (ODF) 与 OASIS 在 2005 年批准为文档格式标准的 "Open Office XML Format 具有相同的来源。ODF 最初是作为 OpenOffice.org 的文档格式而设计的,原本是一种支持在 OpenOffice.org 与其他支持应用程序之间进行交换的文档格式规范。OpenOffice.org 受到越来越多的关注是由于美国马萨诸塞州政府发表的一则关于开放文件格式将用于政府机构间文档交换的声明。此项政策引发了文档标准的许多重要问题,包括 PDF 的作用、辅助功能和帮助技术,甚至包括读写 ODF 所需的程序。

ODF 的设计目的是代表 OpenOffice.org 产品中的功能,它最初叫作“Open Office XML Format”。与专门为转移旧版文件中的信息而设计的 Open XML 不同,ODF 并没有为代表已创建文档中的现有内容而进行优化,它最初的设计目的只是反映由一个应用程序创建的信息。例如,OASIS 标准机构中的 ODF 技术委员会声明:电子表格公式(例如“SUM”和“Average”)的标准化标记语言 超出了它们的宪章的范围"。

当今的大多数主要商业生产力套件也都支持 ODF。Microsoft Office 用户可以从开放源代码软件社区下载并安装免费插件,以将文档转换为 ODF。Open Office 也使用 ODF。Corel 已声明将在 2007 年支持 ODF。其他商业生产力应用程序(例如 KOffice、AbiWord 和其他程序)也支持 ODF。

它们只是为了完成同样的操作而设计的两种格式,难道不是吗?

对 ODF 和 Open XML 标准化的赞美之词已经引发了对每种格式的优点的争论。拥护 ODF 的人声明 Open XML 和 ODF 都是为同样的目标而设计的,但是只能存在一种格式。Open XML 的拥护者以及大多数用户支持 Open XML 和 ODF 的设计是针对不同用途,它们应当共存以满足不同的用户需求,就像 PDF、RTF、HTML 和无数其他现存的文本和文档格式一样。

ODF 和 Open XML 的标准化过程引发了许多相关争论;规范中的微小技术细节引发了许多争论,文件格式的知识产权提供条款也引发了许多争论。实际上,Ecma Office Open XML 格式和 Open Document Format 在标准化过程中有许多相似之处。这两个标准都经历了多个公司和其他利益方的长时间技术审阅。这两种格式都源自软件产品;ODF 源自 OpenOffice(最初称为“Open Office XML Document Format”),Open XML 是过去 Office 版本的专有 .doc、.xls 和 .ppt 文件格式的反映。

ODF、Open XML 和其他格式之间的实际区别并不带有政治色彩和修饰成分。与 Open XML 相比,ODF 规范较为简短,但是没有为代表现存文档的内容进行过优化。Open XML 规范针对转移数十亿现有文件所需的精确级别和细节进行了优化,包括电子表格公式的完整规范和 ODF 规范中缺少的许多其他功能。Open XML 还提供了在文档格式中承载自定义数据语言的独特能力。组织可以使用 Open XML 报告其他应用程序和系统中的信息,不必先进行转换。对于寻求将实时业务信息合并到文档中的开发人员,或寻求使用自己的分类系统“标记”文档以提高内容理解能力的开发人员,此功能是一项重要创新。

生产套力件中对 ODF、Open XML 以及 PDF、RTF 和 HTML 的支持说明了这样一个事实:客户需要许多文件格式来完成他们所做的工作。为了支持对文档格式的各种需求,目前许多转换项目都在开发之中,目的是为 Open XML、ODF、UOF、PDF 和其他格式之间的转换提供方便。事实上,想使用多种格式的客户的需求可以通过开发出支持多种格式的产品实现,也可以通过使用转换器在这些格式之间交换数据来实现。

为什么不能仅保留一种文档格式呢?

当考虑这个问题时,有必要将其与更容易理解的现实示例进行比较。大多数政府需要车辆来完成政务。无论是救火车、救护车、警用巡逻车、犯人押运车、大容量运输车、铲雪车还是其他用途的车辆,任务的多样性和公众的各种需求都要求政府对不同的任务灵活使用正确的车辆。同样,开放文件格式对于不同的人具有不同的意义,一种文档格式不能满足所有创建和使用文档的需求。就像救护车不适于清洁街道、铲雪车不能运送上下班的人群一样,当今软件使用情况的现实表明:需要许许多多文件格式共存,才能满足软件应用程序中的大量不同的需求。图像文件格式、可编辑文档格式、固定文档格式、归档格式、电子表格格式、页面布局格式、电子邮件格式、绘图格式和无数其他格式共存,才能满足软件使用的需求。某些文档格式经过优化,以提供不能更改的固定静态信息表示。可编辑文档格式的设计目的是最大程度地提高可编辑性。特殊格式(例如电子表格或页面布局文档格式)的设计目的是满足软件应用程序和系统的特定要求。

假设一种包含 PDF、Microsoft Office Excel 和 Microsoft Project 的常见情况。所有这些程序都共享信息,许多都提供了在任意时间来自特定项目的信息。但是,将这些信息合并成一种格式几乎没有任何意义,因为以这些格式表示的数据都用于不同目的。此应用程序的 PDF 文档用于表示信息的最终版本。Excel 可以用于执行 PDF 不适合完成的数据分析。Project 文件包含有关项目所有者可编辑的任务和资源的信息,不适合进行分析,也不适合以最终格式进行广泛分发。将这些文档格式合并起来几乎没有任何意义。

事实上,文档格式交换的真正原则(包括在多个应用程序中使用和与现有文档进行最大程度的兼容)要求能够为手边的任务选择最合适的格式。立法或强制使用单一文档格式是一种武断的措施,不能反映当今软件使用的现实。

附录:增加客户的选择和推动创新的重叠标准示例

标准(包括多种 ISO/IEC 标准)范围重叠的情况非常普遍。为了让标准满足不同用户需求,允许重叠,重叠可以促进创新。

  • 数字媒体格式
    • 图像数据。存储数字图像数据的标准有多种,例如 CGM(ISO/IEC 标准)、ASCII 图形交换、DPX(ANSI/SMPTE 标准)、GIF、JPEG(ISO/IEC 标准)和 PNG(ISO/IEC 标准)。每种格式满足了类似但相互重叠的针对图形、静态图像、扫描图像、动画、图形设计等的不同需求。
    • 视频。数字视频的编码和压缩有许多重叠的标准,例如:用于 VCD 的 MPEG-1(ISO/IEC 标准);用于 DVD、超级 VCD 以及广播公司、电缆运营商和卫星直播所传播的数字电视信号的 MPEG2(ISO/IEC 标准);用于大型视频的在线传播的 MPEG-4(ISO/IEC 标准);以比上述标准低很多的比特率提供高质量视频的 H.264(由 ISO/IEC 和 ITU-T 联合开发)。同样,在高速传输数字视频方面,有许多重叠的数字接口标准,包括 FireWire(IEEE 标准)、HDMI、SDI(ITU-R 和 SMPTE 标准)、DVI、UDI、DisplayPort(VESA 标准)和 USB。
  • 现有文档格式
    • 我们现在有(将来也不断需要)多种重叠文档格式标准以满足各种用户的需求,其中一些是现有 ISO/IEC 标准,包括 HTML、ODF 和 PDF/A。事实上,JTC1 Directives 自身包含一个列表,其中包括为不同目的而分发 JTC1 文档可能使用的不同格式类型(请参见 JTC1 Directives Edition 5,版本 2.0,Annex H)。例如,JTC1 策略引用了六种不同的格式(HTML、TXT、DOC、PDF、WP 和 RTF),并将它们针对不同目的(例如用于标准、Web 浏览或复杂文档)进行了从“强烈推荐”到“不推荐”的评级。针对相同文档的使用,某些格式被评为“强烈推荐”或“可能”,表明有多种文档格式来满足同一需求。
  • 数字电视格式
    • 在 1996 年,当 FCC 采纳 ATSC DTV 标准时,它拒绝强制实施特定的受支持视频格式,这是因为基于这样的结论:“如果不强制实施,则可以提供更多的选择和多样性,使计算机设备和软件公司有更多机会通过提高互操作性来进行竞争,并通过在新产品和服务的可用性方面的增强为客户带来更多利益。”进言之,FCC 以“允许客户选择最适合他们的格式”作为首选,促进了数字广播的采用。
    • 在允许使用隔行或逐行扫描、480、720 或 1080 线分辨率以及 16:9 或其他长宽比进行传输方面,FCC 追寻的是“促进至少能预测出结果的这些技术之间的竞争,而选择权在于市场和客户需求”。它还得出这样的结论:“允许市场来测试和决定视频格式可以避免政府在市场中的错误干预。”
  • 无线标准
    • 在 IEEE 开发的 802.11 无线标准系列中,人们曾普遍认为 Wi-Fi 和蓝牙协议两种直接相互竞争和互斥标准。但是,Wi-Fi 和蓝牙很快被理解为针对不同的市场阶层的标准:前者范围广,最适合家庭和办公室网络的需要;后者范围有限,成为手持设备和其他小型家电的首选。Infrared Data Association (IrDA) 采纳的标准也是重叠标准,这些标准用于通过红外线进行小范围数据交换,例如用于个人区域网 (PAN)。