近一个多月,项目之事轻松了不少,便毫无头绪地阅读了不少专业相关论文,无奈内容甚广,无从下手。近日终于在top journal——IJGIS中看到了一期Special Issue,专门介绍了Distributed Geographic Information Processing (DGIP) research,如获至宝,遂加以研读。

    开篇是乔治梅森大学的YANG和NASA喷气动力实验室的RASKIN写的综述性文章Introduction to distributed geographic information processing research,鄙人才疏学浅,入行时间不长,只好将此文作为切入点,为以后研究寻找方向。以下是鄙人研读完本文之后的一些简录,英语翻译水平不佳,希望不影响理解:

    在引入论题的阶段,作者指出DGIP是指分散在计算机网络和其他通信方式中的各处理单元,对地理信息进行交叉处理的过程。现代分布式地理信息处理的应用包括LBS(移动定位服务),SDIs(空间数据基础设施),NSDI,Google Earth,Virtual Earth等等。特别是GE,VE,它们提供了一个平台,让每个人都能够成为信息的提供者,并可以自由的输入,评论以及共享分散的地理信息。

    对分布式地理资源需求的迅速增加,促使了一些新的研究领域诞生,包括:1.如何设计一个灵活的体系结构;2.如何合理利用、分配电脑计算能力进行空间计算;3.如何构造一个整合了时间、空间和其他要素的空间模型和框架;4.如何解决不同地理信息处理单元之间的互操作性;5.如何利用知识进行智能化处理;6.针对具体问题的应用。这六点也正是本综述的核心。

    一、体系结构(architecture),一个成功的体系结构必须灵活的集成各种分布式处理资源,这些资源可能是已经成熟的技术,也可能是正在发展变化中的技术。比较流行的architecture包括SOA和FEA(联邦企业架构)。

    二、空间计算(spatial computing)需要解决的问题是如何分配利用空间分布的计算资源。空间计算技术为DGIP提供了高级的处理平台。这些处理平台包括网格计算平台、P2P计算平台、云计算平台、高性能计算(HPC)平台等。我们可以利用高性能计算平台进行实时处理,使用网格计算平台进行耗时处理,利用P2P计算平台实现海量用户之间的空间信息共享,以及采用云计算平台,普通用户可以访问复杂的计算设施。

    三、模型(models)的构建是为了定义一套地理信息的规则,这种规则满足了信息收集、存档、集成以及表示过程中推理和计算的需要。模型的构建多是为具体应用服务的,例如土地覆盖、土地利用等。DGIP需要建立一个灵活的模型框架,便于分享各种地理模型。

    四、互操作性(interoperability)在未来十年将会成为一个重要的研究领域。其目标是实现完全的即插即用式地理信息处理单元。许多组织,包括FGDC(联邦地理数据委员会)、OGC(开放地理空间信息联盟)、ISO/TC211(国际标准化组织),都在进行标准化的研究与建设。

    五、智能化(intelligence)对许多实际应用领域来说非常重要,尤其是涉及知识应用的领域。语义网络的发展形成了一系列描述性语言来描述基本概念和简单关系,例如万维网本体语言(OWL)和资源描述框架(RDF),但标准化语言还无法表示复杂的逻辑关系。所以尚需生产一个推理引擎来实现自动化处理并提供高质量的决策支持。此外,RDF和OWL中也没有提供空间概念的描述。

    六、实际应用(applications)。比较成功的应用包括SDI(空间数据基础设施)、Google Earth和Virtual Earth,但这些应用过于简单,我们需要建设一个重要的基础设施以部署复杂的逻辑系统,在全球环境中实现即时的决策辅助。这样的网络基础设施应当集成更加复杂的数据,并结合空间、时间和物理参数,做出更加精准的预测。

    文章第三部分具体介绍了本期专题的五篇选文。每一篇都涉及了这六个领域里的一个或多个方面。能够进IJGIS专题的文章,都是精挑细选的精品论文,是各个领域大牛成果的结晶,所以有必要仔细加以研读,此乃后话。

    第四部分,作者竟然直接将这六个领域里每个重要的研究子领域用标题形式列了出来,由此可见作者真是用心良苦。有兴趣研究的同学可以下载本文学习。当然,鄙人认为科研之道在于先博后专,在致力于某个子课题研究之前,应先将专业的整体脉络把握住,再进行下一步探索。

    结论部分,作者指出DGIP的最终目标是建设一个能够综合解决整体或局部问题的信息基础设施。他打了个很贴切比方:"What is the possibility of flooding for Mississippi river in 2020 and how can we best prepare for it?"。再将目标具体到各个领域:1)一个灵活健壮的体系结构,它可以整合各种成熟的互操作的服务;2)分配合理、容易获得的计算资源,支持地理信息的有效处理;3)一个综合的互操作性强的模型框架,它集成了所有需要的地理信息;4)强大的互操作性,我们可以利用即插即用式的处理单元来共享地理信息资源;5)地理知识的获取和空间推理引擎的开发;6)实际应用中提供高质量的产品输出,用于决策支持。实际上还是那六个方面。

    最后作者列举了一些DGIP研究的进展,包括:1)一些地理信息共享组织自发展开的DGIP研究,2)OGC开展的互操作性研究,3)专业机构和业界对网络的进一步开发与研究,4)许多大型机构开始认识到知识管理的重要性,5)业界和政府单位逐渐开始建立以SOA和FEA为基础的体系结构。

    本文将分布式处理错综复杂的理论进行了分类,帮助我们理清知识结构。所列出的这些领域,也是未来GIS的发展方向。做科研,不可以为了做而做,或是看到别人都在做于是自己也跟着做。对GIS研究来说,我们首先应该明确的是为了达到一个什么目标而研究,正如本文所说,我们应当建立怎样一个信息基础设施,以解决例如预测和应对2020年密西西比河洪水这样的问题。而能够为这一目标做出一点理论或实际的贡献,才是我们做研究的真正目的。