智能 XML
IDOL 服务器能够让组织真正实现 XML(可扩展标识语言)
Autonomy 已经独家开发出功能齐全、商业可扩展的基础架构解决方案,能够自动使用具有任意结构的原始 XML。因此,它可消除组织因需手工创建 XML 标签而造成的效率低下,因为手工创建 XML 标签时,必须了解标签本身和/或相关信息的内容和用途。
“利用 XML,电子商务交易伙伴双方有望加深对彼此商务系统的了解。问题是企业在将其信息转换为支持 XML 的格式时会遇到困难。Autonomy 的 XML 自动化解决了当今要求手工准备 XML 业务文档而形成的主要障碍。”
Hadley Reynolds,波士顿特尔斐集团研究总监
将智能添加到 XML
XML 已被广泛采用,但其部署仍然受到明显的限制。不仅仅是因为标签经常需要手工选择,成本十分昂贵,还因为 XML 没有内建概念理解,而这些概念彼此十分相似。例如,在 XML 中,标签 和标签 是完全不相关的项目。这典型地反映了一个重大问题,因为不同来源的信息是基于不同的标签方案架构起来的,它们无法统一,即使其中的重要概念相似时也是如此。XML 要成功地充当真正的信息交换标准,概念理解的缺少无疑是一大缺陷。
IDOL 服务器带领我们前进了一步,它提供了关键的智能层,即理解标签及其相关信息的内容和用途。如果供应商想让原始 XML 成为其核心架构的智能部分,IDOL 服务器是一个十分关键的组件。
无缝 XML 互操作性
IDOL 服务器提供一个基础架构,用于在使用不同 XML 标签方案的应用程序之间实现完全自动的互操作性(这建立在对 XML 文档而非标签本身的概念理解上),并将其与所有其他 Autonomy 功能相结合。
充分利用 XML 的最大优势
这可让组织可以克服 XML 的常见问题:
IDOL 服务器以自动的方式解决了智能处理 XML 内容的问题。IDOL 服务器能够概念性地理解 XML 内容,从而可以根据信息中包含的概念,将 XML 标签和链接自动插入到文档中。这将消除所有手工成本。其次,IDOL 服务器使 XML 应用程序可以理解概念信息,而不受标签方案差异或所使用应用程序多样性的影响。这意味着,可自动统一不同来源、使用不同标签方案的即有数据,并对其进行自动操作。
IDOL 服务器集成
IDOL 服务器同时面向最终用户和 OEM(原始设备制造商)提供。OEM 可以将智能 XML 功能作为 IDOL 服务器的一部分嵌入到自己的产品中,IDOL 服务器是一个基础架构,可以让多个第三方应用程序自动进行非结构化数据的业务操作。
对于处理结构化、非结构化和半结构化信息的应用程序来说,IDOL 服务器是完全实现其自动化的第二步。Autonomy 的技术易于集成,并使客户可以充分利用 XML 提供的机会。
关键优势
其他应用中的 Autonomy 和 XML
巧妙地结合 Autonomy 与 XML 可以应用于供应链管理等领域,该类领域需要更多的非结构化信息来说明质量或补充细节,就此也可充分发挥 XML 准确记录产品代码和目录号的强大功能。
在这种情况下,除了自动创建标签本身之外,Autonomy 还能够分析和处理相关的外围信息。例如,飞机制造商可能已经同意大量组件交付的自动化,而在实际中,与制造技术、支持问题或安装说明的变化相关的附加信息块会对此产生影响。通常,如果供应链管理的自动化失效,人类就不得不手工处理此类信息,更糟糕的可能是信息已经丢弃或根本无法识别。
在这种情况下,除了自动创建标签本身之外,Autonomy 还能够分析和处理相关的外围信息。例如,飞机制造商可能已经同意大量组件交付的自动化,而在实际中,与制造技术、支持问题或安装说明的变化相关的附加信息块会对此产生影响。通常,如果供应链管理的自动化失效,人类就不得不手工处理此类信息,更糟糕的可能是信息已经丢弃或根本无法识别。
与之类似,同样的问题可出现在商务应用领域。XML 可以让电子商务供应商以一般方式标记产品及相关信息(价格、尺寸、颜色和性能等),让客户更加轻松地在网络上货比三家。
然而,模式的自动组件也可能失效,例如把花裙子归类为印花服装。最终,可人工读取的 XML 标签能够提供简单的数据格式,这些标签的智能定义以及对标签用法的共同遵守将决定其价值。为了真正从 XML 的使用中受益,有必要进行例外处理并解决思想距离问题,这对于真正发挥系统的作用至关重要。
XML 限制
在将来,XML 的主要特色很可能是从在线信息源转换为 B2B 交易服务器的应用开发。然而,与所有标签方案一样,它也受到许多限制。如果没有 Autonomy 的 IDOL 服务器解决方案,要确保 XML 减少成本并提高信息管理效率,显然会遇到重大障碍。如果没有充分认识到这些障碍,或不太了解如何自动处理工作繁重的管理流程(XML 即依赖于此自动化),则可导致劳动成本升高和描述性的不一致。
手工处理
XML 的限制源于选择和应用标签所采用的手工处理。对于人类行为的影响和手工描述信息的内在限制,一个典型的示例是美国国防部法令所产生的结果,它规定:撰写文档的内部用户还要创建文档内容的适当描述。乍看之下,这是一项明智而又讲究实效的决策。然而,实施数月后,我们发现大量文档的描述并不精确,只是标记为“常规”。
尽管 XML 尝试避免使用此类通用术语,但仍然无法摆脱人为“不一致”的弱点。个人描述信息的能力取决于个人的经验、知识和观点。此类“无形物”因人而异,并取决于环境,明显地降低了结果的有效性。
当主题包含多个小主题时,会出现更复杂的问题。关于“对外政策变幻莫测的环境下俄国的技术发展”的文章是应该归类为 (i) 俄国技术 (ii) 俄国对外政策,还是 (iii) 俄国经济呢?决策过程既复杂又耗时,并带来了更多的不一致,尤其是考虑到用户可用选项的总数时。例如,一般报纸主题有 800 多个标签,这让在合理的时间内选择潜在基本主题描述成为一项艰巨的任务。
关于 XML 的一大悖论是,您定义的标签越多,您的应用程序将越准确。然而,您拥有的标签越多,意味着加标签者拥有的主观选择就越多,从而您的应用程序最终就越不精确。
思想距离
XML 标签同样未能突出不同主题之间的关系。所谓的“思想距离”,是指表面上没有联系的标签主题之间往往存在着重要关系,例如,wing design/low drag 和 aerofoil/efficiency。前一类可能包含关于对机翼进行设计以获得最低空气阻力的信息。后一类则讨论高效机翼的制作方式。显然,这些类别之间存在一定程度的重叠,正因为如此,用户可能对两个内容都感兴趣。然而,如果不了解类别名称的含义,则两者之间并不存在明显的关系。
具体性
为了非常具体地检索和处理基于 XML 的文档,就需要大量的标签。例如,路透社之类公司的标签数目可达数几万。然而,随着标签数目的增加,所需劳动和错误分类的可能性也会增加。
标签的互操作性
XML 不是一组标准标签定义,而是一组允许您定义标签的定义。这意味着,如果两个组织要相互操作并了解相同标签的相同含义,他们必须预先明确地就其定义达成一致。
这对于在公共网络上协作的小团体来说,可能还可以实现,然而能否扩大到支持行业贸易伙伴的拓展网络就值得怀疑了。
特别对于某些部门,例如汽车行业,互操作性已经变得十分关键。随着准时制交付、供应商管理存货和供应链集成的出现,以及对运输和仓库贮存依赖性的提高,统一不同行业词汇的需求日益增加。然而,创建鼓励透明互操作性的 XML 规范需要通过专门的途径,这种途径以对全球业务需求的了解为基础。
Autonomy 通过自动处理和管理 XML 标签清除了这些壁垒。因而,Autonomy 可以视为让 XML 之轮实际转动起来的润滑油。




















