地统计分析是空间统计学的一个重要分支,被广泛应用于许多领域。ArcGIS地统计分析功能是借助于ArcGIS地统计分析模块(ArcGIS Geostatistical Analyst)来实现的。

一、ArcGIS地统计分析概述

  1.ArcGIS地统计分析模块介绍

  ArcGIS地统计分析模块(ArcGIS Geostatistical Analyst)是一个完整的工具包,它带有为默认模型设计的稳定性参数。

  2.地统计分析基础简介

  地统计(Geostatistics)又称地质统计,也可以称为空间统计分析。是统计学的一个分支。

  地统计学是以区域化变量理论(theory of regionalized variable)为基础,以变异函数(variogram)为基本工具来研究分布于空间,并呈现出一定的随机性和结构性的自然现象的科学。

二、探索性数据空间分析

  探索性分析可以让用户更清楚的了解所用的探索性分析,包括数据的属性、分布以及空间数据的变异性和相关性,并以此来分析数据的变化趋势,从而利用已知的数据推测拟合未知的数据。探索性分析也可以让用户更深入的认识研究对象,从而对与其数据相关的问题做出更好地分析和决策。

  1.添加探索性数据分析工具

  通常,ArcGIS的探索性数据分析模块并没有打开,需要手动添加。

    ①工具-扩展-选中Geostatistical Analyst

    ②添加Geostatistical Analyst工具条,选择视图-工具条,确保Geostatistical Analyst工具条被选中。

  2.Histogram(直方图)

  Histogram(直方图)指对采样数据按一定的分级方案进行分级,统计采样点落入各个级别中的个数或占总采样数的百分比,并通过条带图或柱状图表现出来。直方图可以直观的反映采样数据特征与规律。

  3.正态QQPlot分布图和普通QQPlot分布图

  QQPlot分布图是可以将现有的数据的分布与标准正态分布对比,从而来分析和评价现有数据。其是利用分布的分位数而做出的图形,如果数据图形越接近一条直线,则它越接近于服从正态分布。

  ①Normal QQPlot分布图(正态QQPlot分布图)

  ②General QQPlot分布图(普通QQPlot分布图)

  4.Trend Analysis(趋势分析)

  趋势分析可以利用样点数据生成以数据某一属性值为高度的三维透视图,从而帮助用户从不同视角分析采样数据集的全局趋势。

  样点的位置由X、Y和Z3个值来决定。X、Y确定样点平面坐标,Z值则是样点数据的某一属性值。三维透视图中的每个黑线就代表了样点的位置和高度,位置就是样点X、Y平面坐标,高度即样点数据的某一属性值的大小。

  5.Voronoi Map(Voronoi地图)

  Voronoi地图是由样点以及样点周围的一系列多边形所组成。多边形生成的要求就是,多边形内任意位置据这一样点的距离,都比该多边形到其他样点的距离要近。

  Voronoi多边形生成之后,相邻的点就被定义为其Voronoi多边形,与选择样点的Voronoi多边形具有公共边的其他样点。

  6.Semivariogram/Covariance Cloud(半变异、协方差函数云)

  半变异/协方差函数云表示的是数据集中所有样点对的理论半变异值和协方差,并把它们用两点间距离的函数来表示,用此函数作图来表示。

  7.Crosscovariance Cloud(正交协方差函数云)

  正交协方差函数云表示的是两个数据集中所有样点对的理论正交协方差,并把它们用两个点距离的函数来表示。

三、探索性数据分析

  探索性数据分析主要利用ArcGIS提供的工具和插值方法,可以确定统计数据属性,探测数据分布、全局和局部异常值、寻求全局的变化趋势、研究空间自相关和理解多种数据集之间的相关性。

  1.检验数据分布

  在地统计分析中,克里格方法建立在一定的假设基础上,其在一定程度上要求所有数据值具有相同的变异性。另外,普通克里格法、简单克里格法和泛克里格法等都假设数据服从正态分布。如果数据不服从正太分布,需要进行一定的数据变换,从而使其服从正态分布。

  因此,在进行地统计分析前,检验数据分布特征,了解和认识数据具有非常重要的意义。数据的检验可以通过直方图和正态QQPlot分布图完成。

    ①通过直方图检验数据分布

    ②通过QQPlot图检验数据分布

  2.寻找数据离群值

  在一组平行测定数据中,有时会出现个别值与其他值相差较远,这种值叫离群值。数据离群值分为全局离群值和局部离群值两大类。全局离群值是指对于数据集中所有点来讲,具有很搞活很低的值的观测样点。局部离群值对于整个数据集来讲,观测样点的值处于正常范围,但与其相邻测量点比较,他又偏高或偏低。

    ①利用直方图查找离群值。

    ②利用半变异/协方差函数云来识别离群值

    ③利用Voronoi图查找局部离群值

   3.全局趋势分析

  全局趋势分析可以通过Trend Analysis(趋势分析)工具来实现。地物的空间趋势分析反映了空间物体在空间区域上变化的主体特征。

  趋势面分析主要依靠空间样点数据,通过数学的方法来拟合一个空间曲面,从而大致反映其空间分布的变化情况。要注意的是一个表面主要是由确定的全局趋势和随机的变异误差来共同决定的。而趋势面分析则会忽略这种局部的变异,只揭示其空间物体变化的总规律。

  4.空间自相关及方向变异

  地理空间自相关是指时间序列相邻数值间的相关关系。大部分的地理现象都具有空间自相关性,及距离越近的两事物越相似。地理研究对象普遍存在的变量间的关系中,确定性的是函数关系,非确定性的是相关关系。如果存在空间自相关,那么该变量本身存在某种数学模型。半变异/协方差函数云就是这种关系的定量化表示。

  5.多数据集协变分析

  世界上的事物不会孤立存在,它们都处于广泛联系之中,并相互制约和影响。变分析主要是通过分析多因数(数据集)关联特征,在地统计空间分析中可以有效利用这种相关特征增强建模效果,如协同克里格插值分析。

四、空间确定性插值

  对采样数据进行分析,并对采样区地理特征认识之后,便要选择合适的空间内插值方法来创建表面。插值方法按其实现的数学原理可以分为两类,一类是确定性插值方法;另一类是地统计插值,也就是克里格插值。

  确定性插值方法以研究区域内部的相似性(如反距离加权插值法)、或者以平滑度为基础(如径向基函数插值法)由已知样点来创建表面。

  确定性插值方法又可以分为两种,即全局性插值方法和局部性插值方法。全局性插值方法以整个研究区的样点数据集为基础来计算预测值,局部性插值方法则使用一个大研究区域内较小的空间区域内的已知样点来计算预测值。

  1.反距离加权插值

  反距离加权插值的基本原理在于,一般来讲物体里的越近,它们的性质就越相近。反之,离得越远则相似性越小。反距离加权插值法以插值点,与样本点之间的距离为权重进行加权平均,离插值点越近的样本点赋予的权重越大。

  2.全局性多项式插值

  全局性插值方法以整个研究区域的样点数据集为基础,用一个数学多项式来模拟计算预测值。其可以视为用一个多项式平面或曲面来全区域的拟合。此方法拟合的表面很少能与已知样点完全重合,所以全局性插值法是非精确的插值法。

  利用全局性插值法生成的表面很容易受极高和极低点值的影响,尤其在研究区边缘地带,因此用于模拟的有关属性在研究区域内最好是变化平缓的。

  全局多项式插值法适用的情况如下:当一个研究区域的表面变化缓慢,即这个表面上的样点值由一个区域向另一个区域的变化平缓时,可以采用全局多项式插值法利用该研究区域内的样点对该研究区进行表面插值。

  检验长期变化的、全局式趋势的影响时,一般采用全局多项式插值法,在这种情况下,应用的方法通常被称为趋势面分析。

  3.局部多项式插值

  局部多项式插值采用多个多项式,每个多项式都处在特定重叠的邻近区域内。通过使用搜索邻近区域对话框可以定义搜索的邻近区域。

  局部多项式插值法不是一个精确的插值方法,但它能得到一个平滑的表面。建立平滑的表面和确定变量的小范围的变异可以使用局部多项式插值法,特别是数据集中含有短程变异时,局部多项式插值法生成的表面就能描述这种短程变异。

  4.径向基函数插值方法

  径向基函数插值法适用于大量点数据进行插值计算,同时要求获得平滑表面的情况。将径向基函数应用于表面变化平缓的表面,如表面上平缓的点高程插值,能得到令人满意的结果。而在一段较短的水平距离内,表面值发生较大的变化,或无法确定采样点数据的准确性,或差样点数据具有很大的不确定性时,径向基函数插值的方法并不适用。

五、地统计插值方法

  地统计插值,也就是克里格插值。克里格方法(Kriging)又称空间局部插值法,是以变异函数理论和结构分析为基础,在有限区域内对区域变化量进行无偏最优估计的一种方法,是地统计学的主要内容之一。

  1.克里格插值基础

  克里格方法和反距离权插值方法类似的是,两者都通过对已知样本点赋权重来求得未知样点的值。不同的是,在赋权重时,反距离权插值方法只考虑已知样本点与未知样点的距离远近,而克里格方法不仅考虑距离,而且通过变异函数和结构分析,考虑了已知样本点的空间分布及与未知样点的空间方位关系。

  2.普通克里格插值

  普通克里格插值(Ordinary Kriging)是区域化变量的线性估计,它假设数据变化成正态分布,认为区域变化量z的期望值是未知的。插值过程类似于加权滑动平均,权重值的确定来自于空间数据分析。

    ①创建预测图(Prediction Map)

    ②创建分位数图(Quantile Map)

    ③创建概率图(Probability Map)

    ④创建标准误差预测图(Prediction Standard Error Map)

  3.简单克里格插值

  简单克里格插值就是区域化变量的线性估计,它假设数据变化成正态分布,认为区域化变量Z的期望值为已知的某一常数。

    ①创建预测图(Prediction Map)

    ②创建分位数图(Quantile Map)

    ③创建概率图(Probability Map)

    ④创建标准误差预测图(Prediction Standard Error Map)

  4.泛克里格插值

  泛克里格假设数据中存在主导趋势,且该趋势可以用一个确定的函数或多项式来拟合。在进行泛克里格分析时,首先分析数据中存在的变化趋势,获得拟合模型;其次对残差数据(即源数据减去趋势数据)进行克里格分析;最后,将趋势面分析和残差分析的克里格结果相加和,得到最终结果。

  由此可见,克里格方法明显优于趋势面分析,泛克里格的结果也要优于普通克里格的结果。

    ①创建预测图(Prediction Map)

    ②创建分位数图(Quantile Map)

    ③创建概率图(Probability Map)

    ④创建标准误差预测图(Prediction Standard Error Map)

  5.指示克里格插值

  在很多情况下,并不需要了解区域内的每一个点的属性值,而只需了解属性值是否超过某一阈值,则可以将原始数据转换为(0,1)值,选用指示克里值(Indicator Kriging)进行分析.

    ①创建概率图(Probability Map)

    ②创建标准误差预测图(Prediction Standard Error Map)

  6.概率克里格插值

    ①创建概率图(Probability Map)

    ②创建标准误差预测图(Prediction Standard Error Map)

  7.如果原始数据不服从简单的分布(高斯或对数正态等),则可以选用析取克里格法(Disjunctive Kriging),他可以提供非线性估值方法。

    ①创建预测图(Prediction Map)

    ②创建概率图(Probability Map)

    ③创建标准误差预测图(Prediction Standard Error Map)

    ④创建标准误差指示图(Standard Error of Indicator Map)