一、概念
- 主成分分析的提出:principal component analysis,是将多个指标化为少数几个综合指标的一种统计分析方法,即通过降维技术把多个变量化为少数几个主成分的方法。
- 基本思想:将原来众多具有一定相关性的指标,重新组合成一组新的相互无关的综合指标来代替原来指标。
- 数学处理:就是将原来p个指标作线性组合,作为新的指标。x1和x2相关性高,正交变换成y1和y2,相关性变低,信息主要在y1上。
- 目的:是用较少的变量去解释原资料中的大部分变异(方差),即期望能将手中许多相关性很高的变量转化成互相独立(正交)的变量,并能解释大部分资料之变异的几个新变量,即主成分。
- 数学表达:
二、主成分的推导
三、主成分的性质
四、主成分分析步骤:
五、R语言分析步骤:
六、注意事项