主成分分析并不是一个简单的东西,更别说用到地理上。之前,本人弄主成分分析就想了很久,除了计算之外,最后还是把主成分分析弄清楚了。地理学上讲究的是空间,之前不涉及到空间,涉及到空间必须要用到空间分析。那么ArcGIS中的主成分分析表示些什么呢?
本文是基于自己的理解,也不能代表全对。
在ArcGIS做主成分分析就不在赘述了。下图是我主成分分析的一个参数设置。
下图是我结果的一个截图。协方差矩阵和相关矩阵的图层号和输入图层的图层号是对应的。注意:最后那个主成分红框那块和图层没有关系。
讲到这里不得提一提主成分分析的原理了。主成分分析把给定的一组相关变量通过线性变换转换成另一组不相关的变量,新变量按方差依次递减排列,数学变换过程保持变量的总方差不变,第一个变量方差最大,称为第一主成分,第二个变量方差其次,且和第一个变量不相关,称为第二主成分,依次类推。[1]
我的理解:主成分分析是把多个因子进行了变换,有些因子存在共线性就会直接被替代,可以看到最后一张表,可以看到前面几个因子就可以解释全部的变量。所以,最后我框选的那些特征值、特征向量和累积特征值百分比(也被翻译成累积贡献率)和图层存在相关关系,但不是对应值。 如果看不懂这句话,建议补一补理论知识。
最后问题来了,大家肯定想问。最后这个红框和谁存在对应关系呢?
是的,和分析生成的主成分栅格有关系。
最后的最后,大家一定有问题。你们的问题:虽然觉得我是正确的,但是还是不信服我。如果你也有数据,你可以通过这样来检验,先输入1 2 3图层再输入3 2 1图层,计算两次结果,看协方差矩阵、相关性矩阵和累积贡献率的变化,我想这时你就明白我说的东西是正确的了。(当然,我已经验证了。)
Note:对栅格数据进行分析需要对数据进行标准化(是标准化不是归一化),如果不标准化的化主成分分析的结果是不正确的。在SPSS中主成分分析会默认对数据进行标准化,但是ArcGIS中并不会对数据进行标准化,故需要对数据进行标准化。
参考文献
[1]1957—2012 年中国参考作物蒸散量时空变化及其影响因子分析