数据挖掘工具

Unica

SAS/EM

Insightful Miner

IBM IM

SPSS

产品构成(功能模块)

响应(流失)模型、交叉销售模型、市场细分及客户描述、客户价值分析

SAS Base 、 SAS Graph 、 SAS EM

S-PLUS , Insightful Miner, 无数据量限制,含有最丰富的算法库与统计分析函数库

分类、分群、关联、相似序列、序列模式、预测

Base 、 Clementine

图形化界面

Yes

Yes

Yes

Yes

Yes

菜单驱动

Yes

No

Yes

No

No

托拽式操作

Yes

Yes

Yes

Yes

Yes

数据挖掘模型(列举)

神经网络、线性回归、 Logist 回归、后向传播神经元网络、 CHAID 、 CART 决策树、 Na ï ve Bayes 、 RFM 、 K - Mean 等几百个模型和算法

神经网络、决策树、传统统计技术、预测、时间序列、聚类方法、关联方法等

神经网络、决策数神经网络、决策树、最邻近算法、预测、时间序列、聚类方法、 logistic regression, cox regression 等

神经网络、决策数神经网络、决策树、最邻近算法、预测、时间序列、聚类方法、关联方法等

共 12 类模型: Neural Net , C5.0 , C&R Tree , Kohonen , K-Means , TwoStep , Apriori , GRI , Sequence , PCA/Factor , Regression , Logistic

灵活算法

Yes

能自动选择参与模型运算的变量

No

No

No

No

具有多模型整合能力

Yes

Yes

Yes

No

Yes

数据挖掘流程易于管理




一般


数据挖掘流程可再利用

Yes

Yes

Yes

Yes

Yes

数据挖掘流程可充分共享

Yes

No

Yes

Yes

Yes

提供模型评估方法

Yes 

Yes

Yes

Yes

Yes

挖掘结果可集成于其他应用

Yes (能生成标准的 C 代码和 SAS 代码)

No

Yes

No

Yes (但不能脱离 SPSS Clemnetine 平台)

最大数据处理量

16000 个变量、 20 亿条记录


无限制


不限

挖掘过程监控

Yes

Yes

Yes

Yes

Yes

异常处理

Yes

Yes

Yes

Yes


并行处理能力

Yes

No

Yes

Yes

Yes

支持访问异构数据库

Yes

(需单独购买)

Yes

Yes (需单独的模块支持)

Yes

提供二次开发接口函数

Yes

No

Yes

Yes

Yes

扩展能力

No

No

,S语言是个开放的开发平台

No

No

挖掘结果转化为主流格式文件、图形的能力

Yes

No

Yes


Yes

支持多层次分析人员

Yes

能支持业务分析人员、统计分析人员、 IT 人员使用

No

No

No

No

其他

将数学建模过程自动化、支持多层次分析人员使用、对软件使用人员要求低、实施周期短、响应数据快、具有多种报表、易于理解分析结果。

需具备较强的计算机、数据挖掘的理论和实践基础;每年需缴纳第一年软件许可费的 50% 的租费。

可以购买永久使用权,需要较强的数据库与数据挖掘理论基础

必须建立在 DB2 的基础上、分析结果解释困难

需具备较强的计算机、数据挖掘的理论和实践基础