2024-10-31,由香港科技大学(广州)和四川大学联合创建的多模态时空数据集Terra,跨越全球,为地球科学领域提供了丰富的小时级时间序列数据和多模态空间补充信息,意义在于促进时空数据挖掘的未来研究,推动实现更广泛的时空智能。

一、研究背景:

气象环境作为影响人类生活、社会经济发展和生态保护的基本因素,其时空数据的全面探索对于深入理解和准确预测环境变化至关重要。尽管深度学习技术在时空数据和地球科学领域取得了成功,但现有的公共数据集在空间尺度、时间覆盖和时间序列数据的依赖性方面存在限制,这些限制阻碍了它们在实际应用中的最优利用。

目前遇到困难和挑战:

1、空间尺度限制:现有数据集在覆盖全球范围时存在不足,无法全面反映地球环境的复杂性。

2、时间覆盖不足:数据集的时间跨度有限,难以捕捉长期环境变化趋势。

3、时间序列数据依赖性:对有限时间序列数据的依赖限制了模型的泛化能力和预测准确性。

数据集地址:Terra|地球科学数据集|时空数据数据集


二、让我们一起看一下Terra数据集

Terra是一个跨地球的多模态时空数据集,提供全球范围内45年的时空数据,涵盖648万个高分辨率网格点。

Terra数据集整合了时间序列、地理图像和解释性文本数据,覆盖广泛的时空范围,具有高分辨率和多样性。它包括时间序列数据、文本数据和图像数据,能够支持多模态分析与高级模型开发。

数据集构建:

Terra数据集的构建基于对地球多模态时空数据的全面采集与整合。该数据集跨越了广泛的时空维度,涵盖了从地理信息系统(GIS)到遥感图像等多种数据类型。其构建过程涉及对全球范围内数据的系统性收集、清洗与标注,确保了数据的高质量和一致性。

数据集特点:

1、全球覆盖:数据集覆盖全球范围,提供了全面的时空数据视角。

2、多模态信息:整合了时间序列数据、地理图像和文本信息,为深度学习模型提供了丰富的输入。

3、细粒度:支持高达 3 小时的时间粒度和高达 0.1° 分辨率的空间网格记录,通过细粒度的数据属性保证真实应用场景的实际可行性

4、长期时间序列:数据集包含了过去45年的数据,能够支持长期环境变化的研究。

5、高质量标注和系统性整理:Terra数据集的高质量标注和系统性整理,使其在地球科学、环境监测和气候研究等领域具有极高的应用价值。

6、多源数据整合:通过整合多源数据,如卫星遥感、气象观测和地理信息系统,Terra为研究人员提供了丰富的时空数据。

7、高精度数据融合和分析技术:时空数据的复杂性要求高精度的数据融合和分析技术,以确保数据的准确性和一致性。


基准测试:

数据集提供了基准测试,允许研究者评估现有深度学习模型在地球科学领域的性能,并为未来的模型开发提供参考。

Terra : 一个跨时空域的公共、大规模、细粒度和多模态数据集(包含了过去 45 年中遍布全球的各种气象数据,覆盖了648万高分辨率网格点)_数据集

Terra 及其在时空数据智能中的应用概述。

Terra : 一个跨时空域的公共、大规模、细粒度和多模态数据集(包含了过去 45 年中遍布全球的各种气象数据,覆盖了648万高分辨率网格点)_数据_02


Terra : 一个跨时空域的公共、大规模、细粒度和多模态数据集(包含了过去 45 年中遍布全球的各种气象数据,覆盖了648万高分辨率网格点)_机器学习数据集_03

Terra 的不同模态组件。我们提供三个时间尺度(3 小时/每天/每月)和三个空间尺度(0.1° / 0.5° / 1°)的数据。

Terra : 一个跨时空域的公共、大规模、细粒度和多模态数据集(包含了过去 45 年中遍布全球的各种气象数据,覆盖了648万高分辨率网格点)_数据集_04

数据集体积比较。

Terra : 一个跨时空域的公共、大规模、细粒度和多模态数据集(包含了过去 45 年中遍布全球的各种气象数据,覆盖了648万高分辨率网格点)_数据集_05

空间提示工程示例

Terra : 一个跨时空域的公共、大规模、细粒度和多模态数据集(包含了过去 45 年中遍布全球的各种气象数据,覆盖了648万高分辨率网格点)_数据集_06

文本模态数据的统计和可视化洞察

Terra : 一个跨时空域的公共、大规模、细粒度和多模态数据集(包含了过去 45 年中遍布全球的各种气象数据,覆盖了648万高分辨率网格点)_数据集_07

Terra 数据集的潜在应用场景 。所有单一模态都可以与地理坐标相关联。


三、让我们一起展望Terra数据集应用场景

全球植被光合作用效率研究:

目前全球植被光合作用效率的研究主要依赖于地面观测站的数据,这些数据往往分布不均且覆盖范围有限,难以提供全球尺度的连续和全面的数据支持。研究者需要依赖于局部的、分散的数据进行推断,这限制了对全球碳循环和气候变化影响的深入理解。

有了Terra数据集后的改变

1、全球覆盖与高时空分辨率:Terra数据集提供了基于TERRA卫星上的MODIS传感器观测的全球范围内的光合作用数据,包括植被指数、光合有效辐射吸收比率(FPAR)、净初级生产力(NPP)等指标。这使得研究者能够在全球尺度上监测和量化植物光合作用过程,对于理解全球碳循环、气候变化以及农业生产具有重要意义。

2、多源数据融合:Terra数据集通过整合MODIS卫星遥感数据,提供了高分辨率的全球光合作用速率信息,使得科学家能够精确分析不同生态系统中的光合作用动态变化。

3、数据的高精度和全球覆盖:TERRA-MODIS全球光合作用数据集的构建基于MODIS卫星遥感数据,通过整合多光谱影像与地面观测数据,采用先进的算法模型,如光能利用率模型(LUE)和光合作用速率模型(P-model),对全球范围内的植被光合作用进行估算。

4、推动生态学、气象学和农业科学等领域的研究进展:Terra数据集的发布极大地推动了相关领域研究的进展,为全球环境监测和资源管理提供了宝贵的数据支持。

Terra数据集为全球光合作用研究提供了一个前所未有的数据资源,极大地提高了研究的精度和广度,推动了生态学、气象学和农业科学等领域的发展。通过提供全球覆盖的高分辨率数据,Terra数据集使科学家能够更好地理解和预测全球碳循环和气候变化的影响。


更多开源的数据集,请打开:遇见数据集

https://www.selectdataset.com/