业界常见的数据挖掘软件介绍

一、主要介绍12种

1.传统的数据挖掘套件(Classic suites):

SAS Enterprise Miner 5.3
SPSS Clementine 12
2.开源数据挖掘软件(Open Source):Weka 3.4.13
RapidMiner 4.2
KNIME 1.3.5 

3.自动化数据挖掘软件(Self-Acting):KXEN Analytic Framework 4.04
4.专门化的数据挖掘软件(Specialized):Viscovery SOMiner 5.0
prudsys Discovery 5.5 / Basket Analyzer 5.2
Bissantz Delta Master 5.3.6
5.BI产品内置的数据挖掘软件(BI Vendors):SAP NetWear 7.0 Data Mining Workbench
Oracle 11g Data Mining
Microsoft SQL Server 2005 Analysis Services

二、按公司分类 

     SAS公司的 Enterprise Miner; IBM公司的 Intelligent Miner;     SPSS公司的 Clementine;     Statsoft公司的Statistica Data Miner;

   NCR公司的Teradata Warehouse Miner;    Unica公司的Affinium Model; Insightful公司的Insightful Miner;

    Information Discovery 公司的Data Mining Suite;       Angoss 公司的 KnowledgeSTUDIO;

       Fujitsu公司的 GhostMiner;    Oracle公司的 Darwin;

      神州通用:国产的K-Miner数据挖掘软件: MPP+SMP并行计算架构,是目前唯一的所有算法都实现了并行化数据挖掘软件;27个数据挖掘算法+13个统计分析算法;大部分算法执行速度都远快于SPSS等的相应算法。(http://www.shentongdata.com/?bid=3&eid=354

 三.比较著名的有IBM Intelligent Miner、SAS Enterprise Miner、SPSS Clementine等,它们都能够提供常规的挖掘过程和挖掘模式。


    由美国IBM公司开发的数据挖掘软件Intelligent Miner是一种分别面向数据库和文本信息进行数据挖掘的软件系列,它包括Intelligent Miner for Data和Intelligent Miner for Text。Intelligent Miner for Data可以挖掘包含在数据库、数据仓库和数据中心中的隐含信息,帮助用

   

    3.2 Enterprise Miner[5]

   

    3.3 SPSS Clementine

   

其它常用的数据挖掘工具还有LEVEL5 Quest 、MineSet (SGI) 、Partek 、SE-Learn 、SPSS 的数据挖掘软件Snob、Ashraf Azmy 的SuperQuery 、WINROSA 、XmdvTool 等。

 四、比较适合初学者者的有Weka, Spss clementine. 特别是前一个软件,如果想自己更深入学习的话,我们可以用Java 编程设计相应功能的算法来拓展Weka,因为其源代码是开源的,我们可以扩充并重新编译。

为什么要拓展Weka?

1.  需要加入第三方的构件。

2.  需要加入自己设计或者改进的算法

3.  需要将Weka整合到实际的应用系统中。

要点:

1.  重新编译Weka

2.  加入新算法(第三方、自己设计或者改进)。

3.  在自己的Java程序中使用Weka。

 后续博文我会详细介绍拓展Weka的方法。