独特的技术组合
超过 130 项专利技术
开放的理念
在选用方法时,Autonomy 推崇一种开放的理念。无论方法是新兴的或是传统的,只要能够实现技术的优化,就会被采用。因此,Autonomy 并不排斥包括关键词、布尔值、参数在内的各种传统搜索方法。但真
正突出我们特点的是建立在模式识别计算技术(非线性自适应数字讯号处理)以及语境语言分析基础上的创新语义识别搜索功能。
基于托马斯·贝叶斯和克劳德·香农的基础数学研究以及包含了超过 130 项专利技术的创新成果,Autonomy 的技术能够根据与特定概念相对应的词语出现的频率及使用情况识别文字、语音或视频文件中所包含的各种模式。通过确定各特征之间的优先关系,Autonomy 的技术能够判定某段内容有 X% 的可能性是关于某个特定话题。这样内容中的精髓就得以被提取出来。通过对各种概念的特征加以编码,计算机就能够自动地对电子邮件、电话交谈、视频、文档甚至是用户感兴趣的各种信息进行一系列操作。
贝叶斯概率论
托马斯·贝叶斯是 18 世纪的一名英国牧师。他的著作成为了现代统计学概率建模的核心理论之一。贝叶斯的研究方向集中在计算多个变量之间的概率关系,以及在出现新的信息时这些关系受到的变化。
根据传统的统计学理论,即使一个硬币投 100 次后次次都是正面朝上,第 101 次时正面与反面朝上的概率仍然是相等的。但贝叶斯的理论认为:从连续 100 次正面朝上这一事实,我们可以推断该硬币并不均匀。贝叶斯理论明确论述了以下两点:a) 你所掌握的信息量越多,你对问题的认知程度就越高;b) 先前获得的经验可用于推断新的情况。根据贝叶斯的理论,在判定某段内容与用户查询之间的关联程度时,我们可以利用已知的详细情况进行计算。
贝叶斯概率论
香农信息论
Autonomy 的信息代理技术充分展示了该理论的实际运用。用户可以创建自己的代理用于自动跟踪其感兴趣的各方面相关的最新信息,IDOL 将根据代理来判断某个文档的关联程度。自适应概率式概念建模 (APCM) 算法被用于非结构化信息的分析、整理和交叉引用操作。与此类似,由用户判定文档与某个代理档案相关,那这个文档的知识可被用于判断其他文档的相关程度。
大多数其他的模型都需要事先掌握有关系统状态的信息并对其进行训练,而 Autonomy 的模型在开始时完全处于空白状态,它将通过传入的数据完善自身。其遵循贝叶斯理论,将新的信息与日益增多的旧内容相结合来不断完善自身的引擎。
香农信息论
信息论是所有数字通讯系统的数学基础。克劳德·香农提出在通讯时可以将信息作为可量化的数值加以处理。
自然语言包含了大量重复或是不重要的内容。举例而言,若在一个嘈杂的房间内进行对话,收听者可能并不能听到所有的词语,但这并不影响其对整个交谈内容的理解。与此类似,若要了解某段新闻的大意,读者只需简单浏览全文即可。信息论提供的理论框架有助于从这种重复的内容中提取出概念。
Autonomy 的概念建模方法正是建立在香农信息论的基础之上,其中心是当某个交流单元出现的频率越低,则该单元所包含的信息量就越多。因此,交流中出现较少的概念更能指明交流的含义,这一理论使 Autonomy 的软件能够找出文档中最为重要(或者信息量最多)的概念。
“Autonomy 真正走在市场的前列:当其他人还在追求越来越复杂的技术,而对需要处理存储的内容毫不关心时,Autonomy 却开发出了能从真正重要的技术资源和数据中提取有用信息的技术。”
TechWatch Article, Martin Butler, Butler Group




















