外部字典查询
字典方法将向系统提供一组行业特定的术语及其同义词,这样当这些不常见的词语出现时,系统就能理解他们。这种方法适用于术语、缩写以及行话较多的场合,例如医疗和科研领域。比方说,字典方法可以使系统明白如果某人对针对癌症的研究感兴趣,那么他有可能也希望阅读有关“肿瘤学”的文档。但字典方法的不足之处在于其成本昂贵,创建过程过于耗时,且有时其中的定义并不符合语境。
手动
字典中的词语列表要靠专家编订。这是一种耗时并且牵涉大量人工劳动的过程。此外该方法还需要人工预测系统的用户可能使用的所有词语,因此,出错的可能性也很高。不过对于先前信息积累足够的领域,这种问题可能并不显著。
无学习能力
输入系统的词语列表是静态的。这种方法无法学习含义已经改变的词语或新词语。相反,这些信息需要由管理员录入,使得字典的维护也成为了耗时耗力的人工劳动。而 Autonomy 不仅能针对静态的数据集合做出建议,对于持续变更的动态数据集合也能采用不同的处理手段。此外,字典方法理解拥有多个含义的词语时也会有很多困难。例如使用字典方法的系统可能会将“她是一颗冉冉升起的明星”理解为“她是一个气态宇宙天体”。
Autonomy 的方法
Autonomy 对概念的理解是建立在 IDOL 针对全部数据的分析结果之上。因此,在新词汇出现或词义改变时,这些变化的内容将自动更新输入系统,无需手动更新字典。
一个实例:2001 年 9 月 11 日,“Ground Zero”(爆心点)在一夜之间从核武器爆炸点变成了另一种含义。Autonomy 的软件立即了解了这一含义上的变化,明白与之对应的内容从核爆炸变为了针对美国的恐怖主义袭击。Autonomy 与依赖于字典的解决方案不同,它在保留加载并利用现有字典功能的同时,具备了独立于字典运作的能力。
“Autonomy 为 BAE 的虚拟大学、Intranet 和电子学习系统提供的自动化能力,是手动方法所无法实现的。”
Richard West,电子学习与虚拟大学部门负责人,BAE 系统




















