一、莫兰指数
二、莫兰指数、P值、Z值
三、零假设与置信度
四、空间关系概念化
五、距离法
六、标准化
一、莫兰指数
莫兰指数分为全局莫兰指数(Global Moran's I)和局部莫兰指数(Local Moran's I),前者是Patrick Alfred Pierce Moran开发的空间自相关的度量;后者是美国亚利桑那州立大学地理与规划学院院长Luc Anselin 教授在1995年提出的。在Arcgis里分别是“空间自相关”与“聚类和异常值分析”工具。
通常情况,先做一个地区的全局莫兰指数,全局指数告诉我们空间是否出现了集聚或异常值,但并没有告诉我们在哪里出现,回答有或无。
如果全局有自相关出现,接着做局部自相关,局部Moran'I会告诉我们哪里出现了异常值或者哪里出现了集聚。
二、莫兰指数、P值、Z值的解读
Moran's I的范围在 -1.0 与 +1.0 之间。
Moran's I大于0时,表示数据呈现空间正相关,其值越大空间相关性越明显;Moran's I小于0时,表示数据呈现空间负相关,其值越小空间差异越大;Moran's I为0时,空间呈随机性。
解读莫兰指数的时候,需要有P值和Z得分来判定。他们两个要结合在一起看的。如下表与下图。
P值:(P-Value,Probability,Pr),概率的意思。当p很小时,意味着所观测到的空间模式不太可能产生于随机过程(小概率事件),因此可以拒绝零假设。
Z得分:(standard score),标准分数。记住标准差能反映一个数据集的离散程度,就可以了。
z 得分(标准差) | p 值(概率) | 置信度 |
< -1.65 或> +1.65 | < 0.10 | 90% |
< -1.96 或> +1.96 | < 0.05 | 95% |
< -2.58 或 > +2.58 | < 0.01 | 99% |
先看图中,分为三部分,中间黄色部分为随机分布,右侧为集聚分布,左侧为离散分布。
下面有P值与Z得分两行数值。再结合表格看
假如P值<0.01,且Z得分>2.58,那么就落在图的最最最右边红色的区域,我们可以说有99%的把握要素是集聚分布的。对应的,如果P值<0.01,且Z得分<-2.58,那么就落在图的最最最左边蓝色的区域,我们可以说有99%的把握要素是离散分布的。
假如P值<0.01,但Z得分<2.58,那么就表示不可以拒绝零假设,实验是失败的。这里面又涉及到统计上以下两个概念。
三、零假设与置信度
1、零假设:官方的解释是指进行统计检验时预先建立的假设。这个“零假设”的设立是为了去否定它的,空间统计中的零假设是指“我想统计的空间要素是随机分布的”,要去做的也就是去证明要素不是随机分布的,是呈现聚类或者离散分布的。
2、置信度:比如我这个实验结论有95%的置信度,意义就是我有95%的把握拒绝零假设,证明零假设是错误的,是可以实现这个结果。置信区间是保证这个置信度的变量或参数的区间范围。区间越大猜中概率越大。
四、空间关系概念化
在操作窗口,会让选择空间关系概念化,一共有七种,了解了一下
1、INVERSE_DISTANCE(反距离):与远处的要素相比,附近的邻近要素对目标要素的计算的影响要大一些。
2、INVERSE_DISTANCE_SQUARED(反距离平方):与第一种相似,但它对距离反应更为敏感。所以这两种方法区别就在于附近邻近要素对目标要素的计算的影响有多大,特别大就第二种。
如果横坐标代表距离,纵轴代表影响力,那么随着距离增加,影响力就变得越来越小。这就是反距离。
3、 FIXED_DISTANCE_BAND(距离范围影响):将对邻近要素环境中的每个要素进行分析。在指定临界距离(距离范围或距离阈值)内的邻近要素将分配有值为 1 的权重,并对目标要素的计算产生重大影响。在指定临界距离外的邻近要素将分配值为零的权重,并且不会对目标要素的计算产生任何影响。其实就是在一定范围内的临近要素对目标要素影响力是一样的,不存在随距离增加而减小。
横轴代表距离,纵轴代表影响力,在到达蓝圈圈这个点之前,影响力不会衰减,都是一样的。过了这个点就不会产生影响。
4、ZONE_OF_INDIFFERENCE(无差别的区域):在目标要素的指定临界距离(距离范围或距离阈值)内的要素将分配有值为1的权重,并且会影响目标要素的计算。一旦超出该临界距离,权重(以及邻近要素对目标要素计算的影响)就会随距离的增加而减小。
可以看做是“反距离”与“距离范围”的结合,在红圈圈之前影响力都是一样的,超过这个红圈圈,影响力便随着距离增加而减小。
5、 CONTIGUITY_EDGES_ONLY—只有共用边界或重叠的相邻面要素会影响目标面要素的计算。
6、CONTIGUITY_EDGES_CORNERS—共享边界、结点或重叠的面要素会影响目标面要素的计算。可以看到出现了corners角落这个词。
看下面图,我要研究A区域受哪些区域影响,假如我选取了ONLY,那么B和D与A是有共用边的,而C没有共边,所以C是没影响的。假如我选择CORNERS,那么BCD都有影响,因为他们共享了角。在GeoDa里有Rook和Queen,对应的就是only与corners。
五、距离法
指定计算每个要素与邻近要素之间的距离的方式。在操作窗口,也会让选择距离法,有两种。
1、欧氏距离—两点间的直线距离。
2、曼哈顿距离—沿垂直轴度量的两点间的距离(城市街区);计算方法是对两点的 x 和 y 坐标的差值(绝对值)求和。
直线距离 两点之间的垂直距离