本文详细讲述全球人口密度数据LandScan Global(2000-2022)下载与处理流程(附成品下载)。
一、LandScan Global数据集介绍
LandScan Global数据集是一个结合地理空间科学、遥感技术和机器学习算法的全球人口分布数据集,旨在提供最高分辨率的全球人口分布数据。该数据集由美国能源部橡树岭国家实验室(ORNL)开发,官方数据介绍请点击:数据集介绍
数据集具有以下特点:
- 分辨率:LandScan Global的数据分辨率达到1km,这是目前可用的最高分辨率的全球人口分布数据。
- 时间范围:该数据集的时间范围从2000年至2022年,提供了长时间序列的数据。
- 数据获取:用户可以免费下载这些数据,下载过程简单快捷。
- 定制性:由于空间数据的可用性、质量、规模和准确性以及文化定居习俗的差异,LandScan人口分布模型是根据每个国家和地区的数据条件和地理性质量身定制的。
- 应用领域:LandScan Global数据可以应用于人口分布模拟、流行病学研究、环境评估、城市规划等多个领域。
3种数据集:
1. LandScan Global LandScan Global 采用一种创新方法,结合地理空间科学、遥感技术和机器学习算法,是目前分辨率最高的全球人口分布数据,代表了周围(24 小时平均)人口。LandScan Global 算法是 R&D 100 大奖的获得者,它使用空间数据、高分辨率图像开发和多变量 dasymetric 建模方法来分解行政边界内的人口普查计数。由于没有一个人口分布模型可以解释空间数据可用性、质量、规模和准确性的差异以及文化定居实践的差异,因此 LandScan 人口分布模型是根据每个国家和地区的数据条件和地理性质量身定制的。通过对周围人口进行建模,LandScan Global 可以捕捉人们在白天和夜晚的全部潜在活动空间,而不仅仅是一个居住地点。
以LandScan Global为例,ArcGIS中重分类、符号化显示如下:
2. LandScan USA
LandScan USA 采用 dasymetric 人口分布模型来描绘人们在空间和时间上的位置。该模型是对 LandScan Global 项目中使用的方法的扩展和增强,但还包括更精细空间分辨率的昼夜变化。夜间(住宅)和白天人口数据以 3 弧秒(~90 米)的分辨率生成。人口分布模型结合了街区级别的人口普查数据;包括年龄、性别和种族在内的人口统计属性;并整合了其他社会经济数据,例如上班路程。辅助空间数据(包括高分辨率图像、交通基础设施、激光雷达和自动建筑物提取以及地块)用于在空间上细化人口分布。用于增强LandScan USA 输出的其他重要信息包括文化景点、学术机构、监狱、购物中心和商业区。验证和核实是按县进行的,通过评估输入数据是否存在不准确、缺失或过时的数据。
3. LandScan HD
ORNL 利用超过 25 年的开发高分辨率、大规模人口分布模型的专业知识,并为了满足美国以外地区对精细人口数据日益增长的需求,正在为世界各地创建约 90 米分辨率的人口分布数据集。LandScan HD 建模针对各个城市、国家或地区的独特地理和数据条件量身定制。LandScan HD 结合了来自各种来源的当前土地使用和基础设施数据,应用了 ORNL 人口密度表 (PDT) 项目的占用率估计,并利用 ORNL 开发的新型图像处理算法,使用高性能计算环境快速绘制建筑物结构和邻里区域。通过这种方式,LandScan HD 采用“自下而上”的方法开发,其中高分辨率人口估计不依赖于最近进行的高质量人口普查。这种方法对于由于快速增长、自然灾害或冲突而经常经历人口分布巨大变化的地区特别有用。
二、LandScan Global数据集下载
打开官网,网址为:https://landscan.ornl.gov/,你也可以从文末一键下载整套原始数据集与处理好的成品数据,直接用于空间分析与论文写作。
输入简单的基本信息,选择对应的产品与年份等信息即可一键下载,无需注册登录,如下图所示:
1. LandScan Global下载
2. LandScan HD下载
3. LandScan USA下载
三、LandScan Global数据集处理
由于LandScan Global数据集为23期,因此以下讲述采用批量的方式进行处理。
1. 批量裁剪
根据自己的研究区,对人口数据进行批量裁剪,以四川省为例进行演示。文件和文件夹组织结构如下:
- bound:存放矢量范围数据,以四川省.shp为例
- extract:存放裁剪结果
- landscan-global:存放原始数据(压缩包)
组织结构截图:
从官网下载的原始数据为独立的23个压缩包,批量解压方法:将原始数据集全选→右键→WinRAR→解压每个压缩文件到单独的文件夹。
解压完成以后是23个独立的数据文件夹:
注:由于第一个批处理代码(批量裁剪)中加入了文件夹向下遍历的功能,所以采用哪种解压方法,都不会有任何影响。
运行如下批量裁剪代码:
# -*- coding: UTF-8 -*-
import os.path
import arcpy
arcpy.gp.overwriteOutput=1
#arcpy.env.workspace="F:/landscan-global/landscan-global(2000-2022)/"
mask= "F:/landscan-global/bound/四川省.shp"
root="F:/landscan-global/landscan-global/"
RasterList = []
outPath="F:/landscan-global/extract/"
def GetRaster(path):
###请私信作者获取完整python代码
print str(n)+" rasters are processed !!!"
GetRaster(root)
方法是,将其保存为Extract.py文件,右键→Edit with IDLE。
点击Run→Run Module,如下所示:
运行中:
裁剪结果:
ArcGIS验证裁剪结果:
参考阅读:【ArcGIS遇上Python】ArcGIS Python实现长时间序列遥感影像批量处理--以裁剪为例
2. 批量投影变换
3. 其他处理方法
(待续)
四、LandScan Global原始数据集与成品分享
私信作者。