政府

发改委

铁道部

公安部

安全部

国家知识产权局

信产部电信研究院

首都之窗

甘肃省政府

上海市信息中心

上海市徐汇区政府

上海市发改委

上海市小企业办

上海网宣办

青岛外宣办

电信

中国移动

电讯盈科

辽宁移动

江苏移动

湖北移动

河南联通

北京网通

金融

中国人民银行

银监会

信达资产

上海证券交易所

中保财险

能源

中海油

国家电力

媒体

新华社

CCTV

中国日报

中国华闻投资控股有限公司

上海证券报

外文出版局

企业

国航

朗讯科技

施耐德电气

济南钢铁

611所

General Motors

BP

Ford Motor Company

AstraZeneca

HSBC Investment Bank

DaimlerChrysler

CNN

General Electric

US Senate

Credit Suisse First Boston

Volkswagen

Hutchison 3G

UK Department of Trade & Industry

Credit Lyonnais

Siemens

AstraZeneca

Philip Morris

Bloomberg

Lloyds

Verizon

Sun Microsystems

AT&T

XEXCO

FIAT

US Department of Defense

Nestle

HP

US State Department

HSBC

General Dynamics

Hewlett Packard

US State Department

ABN Amro

Ingersoll-Rand

UBS Warburg

US State Department

Nestle

Nestle

Merrill Lynch

New York Stock Exchange

The Economist

France Telecom

New York Life Insurance

Boeing

Lafarge

Safeway

People's Republic of China's

Pfizer

Ministry of Agriculture

Nordea

Lloyds

Tesco

Pfizer

GlaxoSmithKline

Philips

The Coca Cola Company

Nestle

XEXCO

Royal & SunAlliance

Hutchison 3G

Intel

Sybase

BBC

Sprint

New York Life Insurance

Canon USA

T-Mobile

Novell

Ericsson

EDS

Philip Morris International

Royal & SunAlliance

Novartis

Credit Lyonnais

Sun Microsystems

British American Tobacco

Norsk Hydro

AstraZeneca

Henkel

Skanska

BP

BAE Systems

Kodak

The Royal Mail Group

US Department of Defense

Henkel

Bank of Montreal

MOL

Lloyds

Danske Bank

General Motors

BMW

Kronos Corporation

Fujitsu Technology Services

Ericsson

Zurich Financial Services

Accenture

Halliburton

BBC

Blue Cross/Blue Shield of Massachusetts

T-Mobile

Channel 4 Corporation

VHA

HM Revenue & Customs

Burges Salmon

Motorola

Sun Microsystems

British Telecom

Ferrari

Deloitte & Touche

PA Consulting

AT&T

US Army

UK Department of Trade & Industry

EMC Corporation

US Department of Commerce

Encana Corporation

ABN Amro

IEEE

Swiss Army

Hewitt Associates LLC

Hewlett Packard

Britvic Softdrinks

HEALTHvision

Hutchison 3G

Paramount

Lexmark

Hutchison 3G

US Department of Defense

JD Edwards

Ingersoll-Rand

AstraZeneca

General Electric

Macmillan Publishing

PricewaterhouseCoopers

Vodafone Omnitel

Nomura

US State Department

Reed Elsevier

Dow Chemical Company

Siemens Power Generation

Texas Instruments

XEXCO

Forrester Research

McData

Wall Street Journal

Lloyds

AstraZeneca

NASA

Nestle

Philips

SCA

Reuters

ITN

IBM NICA

Forbes.com

Nissan North America, Inc.

Toyota Motor

The McGraw-Hill Companies

Fox Sports

Society of Petroleum Engineers

Ericsson

US Department of Energy

European Commission

Telecom Italia

Harrah's

HSBC

HSBC

AXA

Sybase

General Motors

Napster

Philips

Oracle

Compuware

Olympus

ARM

BBC

Taylor & Francis

Federal Express

Nissan Motor

Milward Brown Precis

Federal Government of Canada

UK Home Office

HM Revenue & Customs

Hutchison 3G

Harvard Business School

BP

Britvic Softdrinks

MOL

Siemens

The McGraw-Hill Companies

Macmillan Publishing

Allianz Life Insurance Co

Swiss Army

Parliament of Singapore

VMS

XEXCO

Singapore Police Force

Siemens

US Department of Commerce

UK Department of Trade & Industry

Sony Music

GSA Advantage!

AstraZeneca

Kaiser Permanente

AstraZeneca

Sun Microsystems

Stanford Business School

Johns Hopkins

Philips

Wachovia

Standard Life Insurance

Raytheon

AstraZeneca

Commerzbank

Allstate Insurance

State of Washington

Danske Bank

Napa Valley County

Texas Department of Transportation

AT&T

American HomePatient

TIBCO

BP

Sharper Image

Xerox

Interwoven

Hutchison 3G

Philips

General Motors

America Online

Hutchison 3G

Lockheed Northrop Grumman

Dow Chemical Company

Draeger Medical

General Motors

Vodafone Omnitel

Sutter Health

Kenyan AIDS Clinic

University of Washington

Hewlett Packard

State of Minnesota

World Wildlife Fund

    公司    
    技术    
    产品    
    功能    
    解决方案    
    服务    
    行业应用    
    客户    
    OEMs    
    新闻和市场活动    
  

向量方向

  向量方法的核心是对数据进行分割,即分类。它将文档视为多维空间中的点,然后将文档分拆到不同的类别中。系统必须学习这些类别,因此,进行的定制越多,分类的准确度就越高。目前有很多的搜索引擎采用了向量方法和布尔值方法的结合。

依赖于语言

  必须对系统进行目标语言的相关定制,系统将只能识别定制的语言单词。而且系统对同义词或相关的单词没有与生俱来的理解能力,例如:系统无法判断 Creutzfeldt-Jakob 和疯牛病(mad cow)是相关的术语。

不够准确

  向量方法的准确性不高,因为其分类方法存在缺陷,尤其是针对可以分入多种类别的文档时。它会将这种文档分入这些类别中的一个,但不能分入所有的类别。此外它也没有阈值或相关度等参数。也就是说这种方法无法指明某文档与其所属类别之间有多大的相关程度。文档对类别主题的论述是泛泛而谈还是详尽的阐述?向量方法无法说明这一点。

手动

  所有的类别必须由管理员手动定义,因此,系统需要持续的监控和维护以保证其运行。类别如有变化,则整个定制过程必须从头开始,因为这种方法不具备针对系统的某一个领域进行更新的能力。

排序的不平衡性

  由于无法比较不同字词对相关性影响程度的高低,该方法会以不常见的词语更能体现文章主题为前提,进而忽略常见的词汇。但这一前提有时并不正确,导致权重和分类错误。

Autonomy 的方法

  Autonomy 的技术以概率为基础理解文档的内容,因此,无需理解某种特定的语言并建立对应的类别。在必要的情况下,Autonomy 可以将一个文档分入多个类别。其自动分类功能确保了在类别的创建和维护过程中,人工干预程度可以自由调节。

  “我们被Autonomy强大的功能深深的吸引了,它可以处理几乎所有的结构化及非结构化信息,这是别的同类产品所无法实现的。它还可以把内、外部信息进行整合。用户们都喜爱它并且对它印象深刻。”

Duncan Fyfe, AstraZeneca