前言
遥感图像往往尺寸较大,无法用默认的图像浏览器加载。
GDAL是空间数据处理的开源包,支持多种数据格式的读写。
遥感图像是一种带大地坐标的栅格数据,因此,可以借用GDAL对遥感图像进行读写,本文就来记录一些相关操作。
GDAL的安装和引入
gdal可通过荧光动力学实验室(Laboratory for Fluorescence Dynamics)提供的镜像网站下载安装:
网站链接:https://www.lfd.uci.edu/~gohlke/pythonlibs/#gdal
有些老版本gdal的引入方式是直接import:
import gdal
新版本的gdal引入方式如下:
from osgeo import gdal
行列数和波段数
下面的示例读取了一张tif遥感图片,输出该栅格数据的行列数和波段数:
from osgeo import gdal
data = gdal.Open("xdu.tif")
rows = data.RasterYSize
cols = data.RasterXSize
bands = data.RasterCount
print(f"rows:{rows}")
print(f"cols:{cols}")
print(f"bands:{bands}")
输出:
rows:37787
cols:36805
bands:4
坐标转换参数
GetGeoTransform()
方法返回栅格数据的坐标转换参数,即行列坐标与空间坐标的转换参数,示例:
from osgeo import gdal
data = gdal.Open("xdu.tif")
geotrans = data.GetGeoTransform()
print(geotrans)
输出:
(298735.10954000003, 0.057460000000000004, 0.0, 3779222.4793800004, 0.0, -0.057460000000000004)
输出值为一个元组,6个元素的含义如下:
- 298735.10954000003:左上角像元x坐标
- 0.057460000000000004:x方向比例尺(像元宽度)
- 0.0:x方向旋转角度
- 3779222.4793800004:左上角像元y坐标
- 0.0:y方向旋转角度
- -0.057460000000000004:y方向比例尺(像元高度)
若影像不含地理坐标信息,默认返回值是:(0,1,0,0,0,1)
空间参照系统信息
·GetProjection()方法返回栅格数据的坐标转换参数,示例:
from osgeo import gdal
data = gdal.Open("xdu.tif")
proj = data.GetProjection()
print(proj)
输出:
PROJCS[“WGS 84 / UTM zone 49N”,GEOGCS[“WGS 84”,DATUM[“WGS_1984”,SPHEROID[“WGS 84”,6378137,298.257223563,AUTHORITY[“EPSG”,“7030”]],AUTHORITY[“EPSG”,“6326”]],PRIMEM[“Greenwich”,0,AUTHORITY[“EPSG”,“8901”]],UNIT[“degree”,0.0174532925199433,AUTHORITY[“EPSG”,“9122”]],AUTHORITY[“EPSG”,“4326”]],PROJECTION[“Transverse_Mercator”],PARAMETER[“latitude_of_origin”,0],PARAMETER[“central_meridian”,111],PARAMETER[“scale_factor”,0.9996],PARAMETER[“false_easting”,500000],PARAMETER[“false_northing”,0],UNIT[“metre”,1,AUTHORITY[“EPSG”,“9001”]],AXIS[“Easting”,EAST],AXIS[“Northing”,NORTH],AUTHORITY[“EPSG”,“32649”]]
栅格数据转数组
ReadAsArray()
方法可实现将栅格数据转换成数组(Array)形式,以便后续处理,示例:
from osgeo import gdal
data = gdal.Open("xdu.tif")
data_array = data.ReadAsArray()
print(data_array.shape)
band1 = data.GetRasterBand(1) # 获取第一个波段的数据
band1_array = band1.ReadAsArray()
print(band1_array.shape)
输出:
(4, 37787, 36805)
(37787, 36805)
对于单波段栅格数据,ReadAsArray()函数返回(rows, columns)
对于多波段栅格数据,ReadAsArray()函数返回(bands, rows, columns)
按块读取栅格
ReadAsArray
同样支持按块读取栅格信息,即读取部分区域图像信息,示例:
from osgeo import gdal
data = gdal.Open("xdu.tif")
data_array = data.ReadAsArray(xoff=15000, yoff=15000, xsize=5, ysize=5)
print(data_array)
输出:
[[[ 56 73 64 57 67]
[ 40 48 60 57 64]
[ 35 45 76 65 62]
[ 42 73 93 74 67]
[ 58 80 92 76 74]]
[[ 71 89 81 76 86]
[ 55 63 77 75 84]
[ 51 61 92 83 81]
[ 58 89 110 93 86]
[ 74 96 109 95 94]]
[[ 34 51 41 35 43]
[ 21 28 40 37 43]
[ 19 28 59 46 41]
[ 27 58 76 55 44]
[ 42 64 72 54 49]]
[[255 255 255 255 255]
[255 255 255 255 255]
[255 255 255 255 255]
[255 255 255 255 255]
[255 255 255 255 255]]]
输出四组5x5的矩阵,表示各波段数据。
其中,该函数具体的参数含义如下:
- xoff,yoff:想要读取的部分原点位置在整张图像中距离全图原点的位置
- xsize和ysize指定要读取部分图像的矩形大小
实现大图显示
有些遥感影像地图通常较大,用微软默认的图片查看器无法打开显示。通是借助QGIS、ENVI这类专业软件进行查看,这类软件的显示逻辑基本上是“分层动态加载”,即全局显示时显示缩略图,放大显示时,重新加载局部的精细图,不过存在的问题是浏览不流畅,每次拖动或缩放时,图片均需要消耗时间来进行重新加载。于是思考,有无其它解决方式?
方案一:拉伸变换
图像无法加载的主要原因是加载图像时,需要将图像的每个像素点信息加载进内存,如果将每个像素点所需内存体积减小,就可能能够直接进行加载查看。
这篇博文[3]采用了对图像进行拉伸变化的思路,对图像的每个像素点进行拉伸变换,处理成8位整型。不过经我实测发现,对于大型遥感图像所起到效果有限,并且十分耗时。
方案二:瓦片显示
瓦片是一个遥感术语,是指将一定范围内的地图按照一定的尺寸和格式,切成若干行和列的正方形栅格图片。整幅图显示不了,那就切分成多个瓦片进行分块显示,再进行组装,可以有效减小资源依赖。
这篇博文[4]采用了该方案进行图像显示。经实测,该方案能够有效解决遥感大图显示问题,并且拖动浏览较为流畅,但在显示之前需要耗费一定时间来切分瓦片。下面是瓦片显示实现的核心代码。
- 切分瓦片
第一步是设定瓦片尺寸为1000x1000,然后根据图像的尺寸来进行切片,主要方式是通过ReadAsArray(w_range_start, h_range_start, w_range, h_range)
来读取区域栅格图像数据,然后保存进字典。
class Tiles:
def __init__(self, dataset, size=1000, image_type=None):
"""
初始化影像瓦片
:param dataset: 影像源数据集
:param size:
"""
# 瓦片大小,默认1000
self.size = 1000
self.image_type = image_type
# 实际的瓦片字典
self.tiles_dict_source = {}
# 显示的瓦片
self.tiles_dict_show = {}
self.dataset = dataset
self.bands = self.dataset.RasterCount
self.width = self.dataset.RasterXSize
self.height = self.dataset.RasterYSize
self.size = size
self.max_value = -99999
self.min_value = 99999
# 横向瓦片个数
self.w_t = math.ceil(self.width / self.size)
# 纵向瓦片个数(图片宽度/瓦片大小(1000))(向上取整数)
self.h_t = math.ceil(self.height / self.size)
# 初始化图层极值
self.native_extremum_array = np.zeros([self.bands, 2])
self.extremum_array = np.zeros([self.bands, 2])
self.static = {}
# 获取各个图层的最大和最小值
for band in range(self.bands):
self.native_extremum_array[band] = [-999999999, 999999999]
self.extremum_array[band] = [-999999999, 999999999]
# 初始化瓦片
self.__init_tiles()
def __init_tiles(self):
"""
瓦片切片
:return:
"""
# 遍历纵向瓦片个数
for h in range(self.h_t):
h_range_start = h * self.size # h下表索引,h_range_start初始范围
h_range = self.size
# 最终越界处理
if h_range_start + h_range > self.height:
h_range = self.height - h_range_start
# 遍历横向瓦片个数
for w in range(self.w_t):
w_range_start = w * self.size
w_range = self.size
# 最终越界处理
if w_range_start + w_range > self.width:
w_range = self.width - w_range_start
# 读取栅格范围数据,保存进字典
tiles = self.dataset.ReadAsArray(w_range_start, h_range_start, w_range, h_range)
self.tiles_dict_source[(h, w)] = tiles
System.signal.signal_progress.emit("正在切分瓦片:", (h + 1) * 100 / self.h_t)
QApplication.processEvents()
- 影像分析
影像分析这步主要是用来统计更新中的影像极值,以便后续拉伸处理。
def image_extremum(self):
length = len(self.tiles_dict_source)
cur = 0
for key, value in self.tiles_dict_source.items():
# 统计极值
for band in range(self.bands):
layer = value[band]
max_new = np.max(layer)
min_new = np.min(layer)
max_old = self.native_extremum_array[band][0]
min_old = self.native_extremum_array[band][1]
if max_new > max_old:
max_old = max_new
if min_new < min_old:
min_old = min_new
self.native_extremum_array[band] = [max_old, min_old]
cur = cur + 1
System.signal.signal_progress.emit("影像分析:", (cur / length) * 100)
QApplication.processEvents()
- 初始化影像显示
此步主要是对影像进行拉伸变换,将影像值拉伸到0-255之间,然后将处理后的数据保存进一个新的字典tiles_dict_show
def stretch_extremum(self, array):
"""
影像拉伸-将影像值拉伸到0-255之间
:param array:
:return:
"""
show_tiles = np.empty(array.shape, dtype='uint8')
for band in range(self.bands):
# 影像极值
max_value = self.extremum_array[band][0]
min_value = self.extremum_array[band][1]
coefficient = (max_value - min_value) / 255
if self.bands == 1:
coefficient_array = array[:, :] / coefficient
else:
coefficient_array = array[band, :, :] / coefficient
coefficient_array = coefficient_array - min_value / coefficient
show_layer = coefficient_array.astype('uint8')
if self.bands == 1:
show_tiles = show_layer
else:
show_tiles[band] = show_layer
if self.bands == 1:
return show_tiles
else:
return np.rollaxis(show_tiles, 0, 3)
def init_show_tiles(self, native=True, max_pix=255, min_pix=0):
"""
初始化用于显示的影像瓦片
:param min_pix:
:param max_pix:
:param native:
:return:
"""
self.__set_extremum(native, max_pix, min_pix)
length = len(self.tiles_dict_source) # 瓦片字典的长度
cur = 0
for key, value in self.tiles_dict_source.items():
# 显示光学影像
# 将需要显示的保存到tiles_dict_show字典中
if System.m_image_type_optical == self.image_type:
self.tiles_dict_show[key] = self.stretch_extremum(value)
# 显示雷达影像
elif System.m_image_type_radar == self.image_type:
self.tiles_dict_show[key] = self.radar_show(value, 255, 0)
# 更新进度条信息
cur = cur + 1
System.signal.signal_progress.emit("初始化影像显示:", (cur / length) * 100)
QApplication.processEvents()
- 创建瓦片并显示
最后这步是根据每一个瓦片的数据,单独创建一个pixmap,从而能够使其在QGraphicsView
进行显示。
def create_pixmap(self, image_array):
"""
根据给定的数组生成pixmap
:param image_array:
:return:
"""
shape = image_array.shape
height = 0
width = 0
bytesPerComponent = 1
if len(shape) == 2:
height, width = shape
elif len(shape) == 3:
height, width, bytesPerComponent = shape
bytesPerLine = bytesPerComponent * width
if bytesPerComponent == 1:
# 显示灰度图像
QImg = QImage(image_array.tobytes(), width, height, bytesPerLine, QImage.Format_Grayscale8)
elif bytesPerComponent == 3:
# 显示GGB图像
QImg = QImage(image_array.tobytes(), width, height, bytesPerLine, QImage.Format_RGB888)
else:
# 如果不符合就不显示
return
return QPixmap.fromImage(QImg)
def create_pixmap_tiles(self):
"""
根据显示的图层创建pixmap的瓦片
:return:
"""
length = len(self.image.get_show_layer())
cur = 0
for key, value in self.image.get_show_layer().items():
# 对于每个需要生成的瓦片单独创建一个pixmap
pixmap = self.create_pixmap(value)
self.pixmap_tiles[key] = pixmap
cur = cur + 1
System.signal.signal_progress.emit("正在创建瓦片:", cur * 100 / length)
QApplication.processEvents()
print("pixmap瓦片创建完成")
# self.image.start_image_static()