业界常见的数据挖掘软件介绍
一、主要介绍12种
1.传统的数据挖掘套件(Classic suites):
SAS Enterprise Miner 5.3
SPSS Clementine 12
2.开源数据挖掘软件(Open Source):Weka 3.4.13
RapidMiner 4.2
KNIME 1.3.5
3.自动化数据挖掘软件(Self-Acting):KXEN Analytic Framework 4.04
4.专门化的数据挖掘软件(Specialized):Viscovery SOMiner 5.0
prudsys Discovery 5.5 / Basket Analyzer 5.2
Bissantz Delta Master 5.3.6
5.BI产品内置的数据挖掘软件(BI Vendors):SAP NetWear 7.0 Data Mining Workbench
Oracle 11g Data Mining
Microsoft SQL Server 2005 Analysis Services
二、按公司分类
SAS公司的 Enterprise Miner; IBM公司的 Intelligent Miner; SPSS公司的 Clementine; Statsoft公司的Statistica Data Miner;
NCR公司的Teradata Warehouse Miner; Unica公司的Affinium Model; Insightful公司的Insightful Miner;
Information Discovery 公司的Data Mining Suite; Angoss 公司的 KnowledgeSTUDIO;
Fujitsu公司的 GhostMiner; Oracle公司的 Darwin;
神州通用:国产的K-Miner数据挖掘软件: MPP+SMP并行计算架构,是目前唯一的所有算法都实现了并行化数据挖掘软件;27个数据挖掘算法+13个统计分析算法;大部分算法执行速度都远快于SPSS等的相应算法。(http://www.shentongdata.com/?bid=3&eid=354 )
三.比较著名的有IBM Intelligent Miner、SAS Enterprise Miner、SPSS Clementine等,它们都能够提供常规的挖掘过程和挖掘模式。
由美国IBM公司开发的数据挖掘软件Intelligent Miner是一种分别面向数据库和文本信息进行数据挖掘的软件系列,它包括Intelligent Miner for Data和Intelligent Miner for Text。Intelligent Miner for Data可以挖掘包含在数据库、数据仓库和数据中心中的隐含信息,帮助用
3.2 Enterprise Miner[5]
3.3 SPSS Clementine
其它常用的数据挖掘工具还有LEVEL5 Quest 、MineSet (SGI) 、Partek 、SE-Learn 、SPSS 的数据挖掘软件Snob、Ashraf Azmy 的SuperQuery 、WINROSA 、XmdvTool 等。
四、比较适合初学者者的有Weka, Spss clementine. 特别是前一个软件,如果想自己更深入学习的话,我们可以用Java 编程设计相应功能的算法来拓展Weka,因为其源代码是开源的,我们可以扩充并重新编译。
为什么要拓展Weka?
1. 需要加入第三方的构件。
2. 需要加入自己设计或者改进的算法
3. 需要将Weka整合到实际的应用系统中。
要点:
1. 重新编译Weka
2. 加入新算法(第三方、自己设计或者改进)。
3. 在自己的Java程序中使用Weka。
后续博文我会详细介绍拓展Weka的方法。