数据挖掘的工具介绍

1.工具的分类

一般来说,数据挖掘工具根据其适用的范围分为以下两类。

1.1 通用数据挖掘工具

通用数据挖掘工具不区分具体数据的含义,采用通用的挖掘算法,处理常见的数据类型。

常用的数据挖掘软件有哪些 常用数据挖掘工具_常用的数据挖掘软件有哪些

1.2 专用数据挖掘工具

针对某个特定领域的问题提供解决方案,在设计算法的时候充分考虑了数据、需求的特性。

常用的数据挖掘软件有哪些 常用数据挖掘工具_数据_02

2 数据挖掘工具选择

2.1 数据挖掘工具选择参考指标

  • 功能性:一个好的数据挖掘工具应该能够为每个步骤体哦那个相应的功能集;
  • 可伸缩性:指的是解决负责问题的能力;
  • 操作的简易性:提供友好的用户界面;
  • 可视化程度:数据源的可视化、模型的可视化、结果的可视化;
  • 开放性:数据挖掘工具与数据库(其它数据资源)的结合能力。

2.2 企业如何选择数据挖掘工具

  • 企业的数据挖掘需求;
  • 企业的数据挖掘经验和水平;
  • 企业的数据状态
  • 企业的预算和工具的性能

3 商用的工具

3.1 SAS Enterprise Miner

  • SAS Enterprise Miner是一种通用的数据挖掘工具,按照“抽样-探索-转换-建模-评估”的方法进行数据挖掘。可以与SAS数据仓库和OLAP集成,实现从提出数据、抓住数据到得到解答的“端到端”的知识发现.

3.2 DBMiner

  • DBminer是一个多任务数据挖掘系统,目的是把关系数据库和数据挖掘集成在一起;
  • 能完成多种知识发现:泛化、特性、关联、分类等规则;
  • 多种数据挖掘技术:面向属性的归纳、统计分析、机器学习等;
  • 提供交互式的类SQL语言——数据挖掘查询语言DMQL;
  • 能与关系数据库平滑集成。
  • https://www2.cs.sfu.ca/CourseCentral/459/han/tutorial/tutorial.html

4 数据挖掘开源工具

4.1 Weka

Weka是一款可视化的机器学习和数据挖掘软件,高级用户可以通过Java编程和命令行来调用其分析组件。同时,Weka也为普通用户提供了图形化界面。

  1. 优点:丰富的机器学习和数据挖掘算法库;
  2. 缺点:在统计分析方面较弱

4.2 KNIME

KNIME提供了友好的开源数据集成、数据处理、数据分析和数据勘探平台。KNIME基于Eclipse并通过插件的方式来提供多种功能,并可以集成到各种各样的开源项目中。

常用的数据挖掘软件有哪些 常用数据挖掘工具_SAS_03

4.3 Orange

Orange提供了友好的界面,Orange的强项在于提供了大量的可视化方法,可以对数据和模型进行多种图像化展示,而且支持智能 搜索合适的可视化形式,支持对数据的交互式探索。

  1. 优点:Orange的底层核心采用C++编写,提供了Python脚本语言进行扩展开发;
  2. 缺点:在统计分析分析能力不强,不支持统计检验

5 总结

  • 数据挖掘工具分类
  1. 专用和通用数据挖掘工具
  • 数据挖掘工具选择
  1. 功能性:一个好的数据挖掘工具应该能够为每个步骤体哦那个相应的功能集;
  2. 可伸缩性:指的是解决负责问题的能力;
  3. 操作的简易性:提供友好的用户界面;
  4. 可视化程度:数据源的可视化、模型的可视化、结果的可视化;
  5. 开放性:数据挖掘工具与数据库(其它数据资源)的结合能力。
  • 数据挖掘商用工具
  1. SAS、SPSS、DBminer
  • 数据挖掘开源工具
  1. Weka、KNIME、Orange

挖掘商用工具

  1. SAS、SPSS、DBminer
  • 数据挖掘开源工具
  1. Weka、KNIME、Orange