1.主要聚类算法分类:
1.1 划分方法:K-means(k-均值),K-MEDOIDS(k-中心点),CLARANS(基于选择的方法)
1.2 层次方法:BIRCH(平衡迭代规约和聚类)、CURE(代表点聚类)、CHAMELEON(动态模型)
1.3 基于密度的方法:DBSCAN(基于高密度连接区域)、DENCLUE(密度分布函数)、OPTICS(对象排序识别)
1.4 基于网格的方法:STING(统计信息网络)、CLIOUE(聚类高维空间)、WAVE-CLUSTER(小波变换)
1.5 基于模型的方法:统计学方法、神经网络方法
2.分类与回归算法:
分类(Classification):将数据映射到定义好的群组或者类
回归(Regression):用属性的历史数据来预测未来趋势
2.1 BP(back propagation,反向传播算法):一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。
2.2 LM(Levenberg-Marquardt):基于梯度下降法和牛顿法结合的优化算法,特点是迭代次数少,收敛速度快,精确度高
2.3 FNN(Fuzzy Neural Network,模糊神经网络):具有模糊权系数或者输入信号是模糊量的神经网络,是模糊系数与神经网络结合的产物,汇聚了神经网络与模糊系统的优点
2.4 RBF(Radial Basis Function,径向基函数):具有单隐层的三层前馈网络,是一种局部逼近网络,能够以任意精度逼近任意连续函数,特别适合于解决分类问题
2.5 ANFIS(Adaptive Neural Fuzzy Inference System,自适应神经模糊推理系统):功能与一阶T-S模糊推理系统等价的自适应神经网络,是将神经网络的学习系统机制引入模糊系统,构成一个带有人类感觉和认知成分的自适应系统
2.6 WNN(Wave Nearal Network,小波神经网络):基于小波变换而构成的神经网络模型,即用非线性小波基数取代通常的神经元非线性激励函数(如sigmoid函数),把小波变换与神经网络有机地结合起来,充分继承了两者的优点。
2.7 SVM(support vector machine,支持向量机):V.Vapnik等人在研究统计学习理论的基础上发展起来的一种新的机器学习算法,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。支持向量机根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折中,以获得最好的推广能力。
2.8 CART(Classification and regression tree,分类与回归树):一种十分有效的非参数分类和回归方法,通过构建树、修改树、评估树来构建一个二叉树
3 关联规则(Association):揭示数据之间的相互关系,而这种关系没有在数据之间表现出来
关联规则:用于发现一个事物与其他事物之间的相互联系或者相互依赖性。
关联规则算法:
Apriori:一种最有影响的挖掘布尔规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。
FP-tree 针对Apriori算法的固有缺陷,J.Han提出了不产生候选挖掘频繁项集的算法:FP-树频集算法
灰色关联法:
HotSpot算法:
序列模式分析:将重点放在分析数据之间的前因后果关系,如买了电脑的顾客会在三个月内购买杀毒软件。
时序模式:描述基于时间或者其他序列的经常发生的规律或者趋势,并对其建模。
时序算法:
一元线性回归预测法
多元线性回归预测法
非线性回归预测法
趋势外推法
移动平均法
指数平滑法
平稳时间序列预测法
灰色预测法