通用抓取接口
连接器能自动整合内容、为多个数据源提供统一的解决方案。
企业要想利用充分信息内容,就必须能同时访问大量数据源,包括非结构化数据(如 HTML 页、字处理文档、电子表格、电子邮件)、半结构化数据 (XML) 和结构化数据(如 Oracle、Lotus Notes 和 ODBC 兼容的内容),此外还包括音频和视频等多媒体数据。
数据多样性
Autonomy 解决方案不依赖于单一的文件或数据格式。Autonomy 能处理各种信息类型,并提供多种灵活性很高的组件,用以自动整合两百多个不同的内容格式。这些格式来自于最复杂的存储库,包括:
自动同步
整合是对多个信息存储库的内容、元数据和安全数据进行收集、提取和导入的过程,由 Autonomy 的智能数据操作层进行分析。所有连接器都会对整合文件、安全权利(可选)、记录修改、删除和完成点进行审核,以实现 Autonomy 基础结构和数据源之间的自动数据同步。
安全
很多时候,只根据概念性理解对信息进行整合是不够的,还必须尊重用户查看文档的安全权利。适当情况下,Autonomy 连接器不仅可以整合信息,还能准确地映射所需的安全权利,用以将适当信息发送给授权查看的适当人员。
完全可配置
Autonomy 连接器可以根据不同的网络架构和带宽限制实现完全可配置,从而按照既定安排,以批量或多个同步作业的形式进行整合。
优势
支持的存储库和数据库
Autonomy 为大量的专属数据存储库和文件格式提供标准连接器(亦称 Fetch)。Autonomy 支持多种不同的文档管理系统、存储库和文档格式。请与我们联系,以了解更多信息。
| 文档存储库连接器: | Internet 服务: | ||
| 支持的存储库: | 需要的连接器: | 支持的存储库: | 需要的连接器: |
| ATG Dynamo | ODBC Fetch | Edgar Online | Edgar Online Fetch |
| Intershop | ODBC Fetch | FTP 服务器 | FTP Fetch |
| Sybase | ODBC Fetch | HTTP 服务器 | HTTP Fetch |
| Documentum | Documentum Fetch | MoreOver Web 新闻传送干路 | MoreOver Fetch |
| Exchange Server | Exchange Fetch | NNTP 新闻服务器 | NNTP Fetch |
| FileNet | FileNet Fetch | NewsEdge 新闻传送干路 | FTP Fetch |
| Lotus Quickplace | Notes Fetch | SiteMinder Netegrity | HTTP Fetch |
| Oracle 9i | Oracle Fetch | 电子邮件服务器: | |
| OpenText LiveLink | OpenText Fetch | 支持的存储库: | 需要的连接器 |
| PCDocs-DocsOpen | PCDocs Fetch | Microsoft Exchange | Exchange Fetch |
| Microsoft SharePoint | SharePoint Fetch | POP3 服务器 | POP3 Fetch |
| Siebel 2000 | Siebel Fetch | Lotus Notes | Notes Fetch |
| Vignette | Oracle Fetch | 支持的其他存储库: | |
| Lotus Notes | Notes Fetch | 支持的存储库: | 需要的连接器: |
| 关系数据库连接器: | 其他存储库和数据库 | OmniFetchTM *(1) | |
| 支持的存储库: | 需要的连接器: | 既有系统: | |
| DB2 | ODBC Fetch | 支持的存储库: | 需要的连接器: |
| Microsoft SQL | ODBC Fetch | 关键字搜索引擎 | 取决于存储库 |
| ODBC Databases | ODBC Fetch | ||
| Oracle Database | Oracle Fetch | ||
| 文件系统: | |||
| 支持的存储库: | 需要的连接器: | ||
| NT File Systems | AutoIndexer | ||
| Netware File Systems | AutoIndexer | ||
| UNIX File Systems | AutoIndexer | ||
既有兼容性
所有的 Autonomy 连接器都能够提取存储库中的“全部”信息,如数据库记录中存储的元数据、文档管理系统中的文件记录以及互联网和局域网网页上的元信息。此外,为了利用既有知识库架构中现有的用户文档关系,Autonomy 还可以集成多个既有协作系统,从而为您带来额外好处。存储在 Autonomy 的智能数据操作层后,在该层建立的所有应用程序都能利用此元数据,及其体现的业务规则。
*(1) OMNI FetchTM 是一种通用 Fetch 框架,客户或合作伙伴可用以装备自己的连接器。OMNI FetchTM 可让您从各种类型的本地或远程存储库下载文档。要了解有关 OMNI FetchTM 的详细信息,请参考 OMNI FetchTM 技术简要说明。
导入模块
导入过程由导入模块支持,它会对连接器从多个数据存储库导出的文件进行导入。
功能包括:
导入模块可对从文档中提取的文本执行多项操作,以下仅列举几项主要功能:
导入模块可以导入二百多种文件和数据格式的文本内容,包括:
| 字处理格式: | 演示文档格式: |
| DCA-RTF sc23-0758-1 | Corel Presentations v7.0 8.0 |
| IBM DisplayWrite v1.0 1.1 | Lotus Freelance v96 97 |
| Lotus AMI pro v2.0 3.0 | MS PowerPoint PC v4.0 |
| Lotus Word pro v96 97 | MS PowerPoint v95 97 |
| MS Word for DOS v2.2 to 5.0 | Microsoft PowerPoint 2000 |
| MS Word v1.x 2.0 | Microsoft PowerPoint XP |
| MS Word for MAC 98 | DTP 格式: |
| MS Word for MAC v4.x - 6.x | Quark Xpress |
| Maker Interchange Format 5.5 | Adobe FrameMaker |
| Microsoft Office 95, 97, 2000 | 图形格式: |
| Microsoft Word PC v 2.0 - 5.5 | Macromedia Flash |
| Microsoft Word 2000 | Shockwave Flash |
| Microsoft Word XP | JPEG File Interchange 格式 |
| Microsoft Word v6.0 7.0 | Graphics Interchange 格式 |
| Microsoft Word v8.0 | RP RealPix Streamed PNG, GIF 和 JPG |
| Microsoft Works v3.0 4.0 | Microsoft Windows Bitmap |
| Word Perfect for DOS v5.0 6.0 | 高效格式: |
| Word Perfect for MAC v2.0 3.0 | Microsoft Project |
| Word Perfect for Windows v7.0 | 可交换格式: |
| XYWrite V4 | Adobe PDF |
| 电子表格格式: | HTML, XML, SGML, WML |
| Applix Asterix v2.0 | 多样化文本格式 |
| Applix Spread sheet X | ASCII、Text、CSV、带分隔符的文本、带分隔符的二进制文本 |
| Corel Quattro Pro for windows v7.0 8.0 | |
| Lotus 1 2 3 (老版) v2 3 4 | |
| Lotus 1-2-3 v96 97 | |
| MS Excel v3, 4, 5, 97, 98 xlssr | |
| MS Excel XP | |
| MS Excel cvsr 格式 | |
| MS Works v3.0, 4.0 | |
| Microsoft Excel 2000 |
支持的音频/视频格式
| 音频格式: | 音频/视频格式: |
| 音频交换文件格式 (AIFF) | Apple QuickTime (QT, MOV) v2 和 lower |
| 光盘音频 (CD) | ASF Netshow |
| MP2, MP3 | Audio-Video Interleaved (AVI) |
| 乐器数字接口 (MIDI) | Closed Captioning (SMI, SMIL 和 SAMI) |
| 音频 (RA) | 数字视频光盘 (DVD) |
| 文本流 (RT) | IndeoT Video 5 |
| 声音文件 (SND) | MPEG-1, MPEG-2 |
| Unix 音频 (AU) | Real Media (视频/音频、基于文件和流) |
| 波形音频,包括 WAV、RIFF、PCM-Raw | RealSystem G2 with Flash (SWF) |
| Windows 媒体音频 (WMA) 和 元文件 (WAX) | 视频点播(VOD) |
| Windows Media ASF 和元文件 (ASX) | |
| Windows 媒体视频 (WMV) 和元文件 (WVX) |
多语言支持
Autonomy 支持 60 多种语言,由于其支持丰富的语种,Autonomy 已被部署到世界各地。这些语种包括英语、西班牙语、法语、葡萄牙语、阿拉伯语、日语、汉语、韩语等。
而且,Autonomy 的基础结构技术与语言完全独立。Autonomy 的技术基于或然建模,因此无需使用任何形式的语言分析器或词典。此外,多语言内容输入到知识库时,Autonomy 会自动对其进行管理,以实现对语言类型的动态识别。
提供最具有综合性的“国际化”支持,Autonomy 支持以下语言标准:
|
|
|
Autonomy 技术不会因语言与英语或其他某种语言语法结构的相似程度而有所不同。俚语和其他变体也不会混淆软件。Autonomy 的基础结构 "IDOL" 认为词是一种抽象意义符号,要通过上下文来理解它们的意思,不能生搬硬套地按照语法理解。
优势
Autonomy 的多语言支持可为您提供以下帮助:




















