大数据与数据挖掘

需要人工智能、数据库、机器语言和统计分析知识等很多跨学科的知识。再者,数据挖掘的出现需要条件,第一个条件:海量的数据;第二个条件:计算机技术大数据量的处理能力;第三个条件:计算机的存储与运算能力;第四个条件:交叉学科的发展。

大数据指由于数据量很大(一般是TBPB数量级)而需要更好拓展性的数据处理方法,不仅是数据挖掘,而且包括传统的数据查询等。从方法上,目前一般的商用数据库无法很好地支持大数据的处理。大数据处理的一般思路是数据压缩,数据抽样,数据挖掘等。

大数据只是数据挖掘的出现的一个条件,而数据挖掘只是大数据处理的一个方法。