也是机器学习基础,可以看一下
定义:聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性
1。系统聚类 是将各样品分成若干类的方法,其基本思想是:先将各样品各看成一类,然后规定类与类之间的距离,选择距离最小的一对合并成新的一类,计算新类与其他类之间的距离,再将距离最近的两类合并,这样每次减少一类,直至所有的样品合为一类为止.
2。分解聚类法(decomposition clustering method),聚类分析的一种方法。与“系统聚类法”相反。先将全部样品视为一类,然后按某种准则将其分解成二类、三类,直至每个样品自成一类止。具体步骤:(1)将 n 个样品视作一类 G1,再从中选出一样品归入 G2,使定义的目标函数 L 达到极大。
3。动态聚类法(dynamical clustering methods )亦称逐步聚类法。一类聚类法,属于大样本聚类法.具体作法是:先粗略地进行预分类,然后再逐步调整,直到把类分得比较合理为止,这种分类方法较之系统聚类法,具有计算量较小、占用计算机存贮单元少、方法简单等优点,所以更适用于大样本的聚类分析。 动态聚类法的聚类过程,可用以框图来描述,框图的每一部分,均有很多种方法可采用,将这些方法按框图进行组合,就会得到各种动态聚类法。
4。有序样品聚类法是聚类分析的方法之一。在通常的聚类分析中样品之间彼此是平等的,聚类时是将样品混在一起按照距离或相似系数的标准来进行分类, 但是有些客观现象在聚类时不能打乱原来样品的排列顺序。例如要对儿童生长发育的规律划分成几个阶段, 或对我国解放以后经济的发展速度划分成几个阶段, 同一个阶段的样品要求是互相连接的,也就是说聚类时要求必须是次序相邻的样品才能在一类。这种聚类的方法称作有序样品聚类法。
5。把模糊数学方法引入聚类分析即产生了模糊聚类分析方法。模糊聚类分析方法大致可分为两种:一是基于模糊关系上的模糊聚类法.并称为系统聚类分析法。另一种称为非系统聚类法,它是先把样品粗略地分一下,然后按其最优原则进行分类,经过多次迭代直到分类比较合理为止,这种方法也称为逐步聚类法。我们通常讲的模糊聚类分析是指将模糊数学的原理应用到系统聚类分析的方法。模糊聚类分析的步骤:(1)确定聚类单元全集U;(2)确定聚类准则和聚类因子;(3)根据聚类准则及因子进行数据的调查与整理;(4)将统计数据进行元量纲处理.称为正规化。
这里所谓的模糊性,主要是指客观事物差异的中间过渡中的“不分明性”和“边界不清”的意思,例如商品评价中“质量好、比较好、比较差等”,气象灾害对农业产量的影响程度为“严重、重、轻”,病人患某种疾病的症状是“重、轻”以及“有矿与无矿”,“冷、暖”“多云间晴”都难以明确地划清界限。
聚类方法
1,层次聚类(Hierarchical Clustering)
合并法、分解法、树状图
2. 非层次聚类
划分聚类、谱聚类
❤️❤️❤️❤️❤️ (聚类总体介绍)