全球学术论文编校服务专家

服务全球193个国家

客服1:1772389736 客服2:123860832 NativeEE_China publish@nativeee.com
010-64125081

周一至周五 9:00-18:00
周六至周日 9:00-17:00

学术指导Academic guidance
您现在的位置:首页 > 学术指导 > 新闻资讯

「科技前沿」AlphaEarth Foundations:革新地球观测的虚拟卫星模型

2025年11月13日  阅读数56

2025731日,谷歌DeepMind发布了人工智能模型AlphaEarth Foundations,昵称“虚拟卫星”。其目标是革新地球观测方式,协助研究人员更有效地追踪地球随时间发生的变化。

1. AlphaEarth Foundations简介

AlphaEarth Foundations是一种地理空间嵌入模型,是一种深度学习模型。它以统一的地理框架,将各种地球观测 (EO) 数据集,采用深度学习模型生成的10×10米的64维嵌入向量数据集。

AlphaEarth Foundations实现了三大核心功能:

1)多源数据融合整合光学卫星(Sentinel2)、雷达(Sentine-1)、激光雷达(NASA GEDI)、气候模型(ERA5)等数十种数据源,覆盖光谱、地形、大气等多维度信息,以及维基百科文本数据

2)数据压缩和特征提取AlphaEarth Foundations采用嵌入方法将卫星获取的海量信息压缩为一组64维嵌入向量数据集。相较于现有的同类人工智能系统,这种数据集所占用的存储空间可减少至原来的 1/16,从而显著降低地球观测数据的存储和处理成本。

3)时间序列分析AlphaEarth Foundations采用时空建模架构(STP)将不同时间点的卫星图像视为“视频帧”,学习动态变化规律,实现时间连续性分析(如预测云层覆盖区域)。目前,AlphaEarth Foundations按年生成了20172024年的嵌入向量数据集。这些数据集可直接在google Earth Engine 中分析使用。借助此数据集,而无需运行计算成本高昂的深度学习模型,用户进行许多不同的任务分析,例如分类、回归、变化检测和相似性搜索等。因此,AlphaEarth嵌入向量数据是一种分析就绪,特别各种AI分析就绪的数据集。

微信图片_2025-11-13_100109_695.jpg 

1 AlphaEarth Foundations 的工作原理

2. 什么是嵌入?

嵌入是一种将大量信息压缩为一组较小的特征的方法,这些特征代表有特定意义。AlphaEarth Foundations 模型会获取来自传感器(包括 Sentinel-2Sentinel-1 Landsat)的时间序列图像,并学习如何仅使用 64维向量来唯一表示来源和目标之间的互信息。输入数据流包含来自多个传感器的大量图像波段,模型会获取此高维输入并将其转换为低维表示形式。

若要了解 AlphaEarth Foundations 的运作方式,可以参考一种称为主成分分析 (PCA) 的技术。PCA 还有助于降低机器学习应用的数据维度。虽然 PCA 是一种统计技术,可以将数十个输入波段压缩为少数几个主成分,但 AlphaEarth Foundations 是一种深度学习模型,可以处理数千个多传感器时间序列数据集的输入维度,并学习创建 64 波段表示,以独特的方式捕获相应像素的空间和时间可变性。

嵌入字段是学习到的嵌入的连续数组或“字段”。嵌入字段集合中的图片表示覆盖整个一年的时空轨迹,并具有 64 个波段(每个嵌入维度一个波段)。 

镶嵌入原理.png 

2 64维嵌入向量原理

3. AlphaEarth Foundations对对地观测领域的影响

一直以来,如何将不同卫星观测数据以及其他数据(如地面观测和统计数据等)纳入到统一框架是对地观测领域的难点之一。并发展出了去云、重采样、坐标变换、数据融合等系列的处理方法。然而,这一问题并未很好的解决,依旧面临了数据量巨大、精度不足等系列问题,这些问题可以概况为:信息过载和数据不一致

AlphaEarth Foundations另辟蹊径,通过人工智能的方法从海量的卫星遥感观测数据中提取出全球的10×10米的64维嵌入向量数据集。并以「卫星嵌入数据集(Satellite Embedding dataset)」的形式发布在 Google Earth Engine 平台上。这一数据集覆盖全球每年超过 1.4 万亿个嵌入点,成为目前最大规模的 AI 地球嵌入数据集之一。

这一创举有可能颠覆对地观测,特别是极大的促进全球对地观测AI分析的应用,成为全球智能研究的重要基础数据集。

 

过去一年中,已有 50 多家组织试用了该数据集,覆盖学术界、政府机构与非营利组织。全球生态系统地图计划(Global Ecosystems Atlas)就是其中的典型案例,该项目旨在打造全球生态系统的首个系统性分类资源。借助 AlphaEarth 的数据,其成功将过去未分类的生态区域归入「滨海灌丛」、「极干旱沙漠」等类别,为各国优化自然保护与恢复行动提供科学依据。

 

詹姆斯库克大学全球生态实验室主任 Nick Murray 表示,「这个数据集正在彻底改变我们对未绘制生态系统的认知,对于制定保护区优先级至关重要。」

 

4. AlphaEarth Foundations典型应用

AlphaEarth Foundations为农业监测、环境保护、城市扩张、水资源管理、应对全球气候变化等关键议题提供了前所未有的全局视野。Google Earth Engine社区平台中提供了该数据集的分类、回归、变化检测和相似性搜索等4类典型应用案例,涵盖了传统卫星遥感监测领域的分类、定量分析、时序变化分析和AI智能提取等4大典型应用场景。

1)农作物分类

AlphaEarth Foundations卫星嵌入数据集可以捕获卫星观测和气候变量的年度轨迹。这样一来,无需对作物物候进行建模,即可轻松使用该数据集来绘制作物分布图。基于AlphaEarth Foundations数据集采用简单的无监督的作物分类方法,就可以在不依赖田地标签的情况下,实现作物地图绘制这项复杂的任务。

图:(左)从卫星嵌入中剪裁地图(右)从 CDL 中剪裁地图.jpg 

3(左)从卫星嵌入中剪裁地图(右)从 CDL 中剪裁地图

2)构建回归模型进行参数定量反演

嵌入字段可像用于分类一样,用作回归的特征输入/预测变量。

NASA 的全球生态系统动态调查 (GEDI) 任务沿地面样带以 30 米的空间分辨率每隔 60 米收集一次 LIDAR 测量数据。使用 GEDI L4A 地上生物量密度栅格数据集,其中包含地上生物量密度 (AGBD) 的点估计值,将这些值用作回归模型中的预测变量。使用64D 嵌入字段层作为输入,可以可以进行预测地上生物量 (AGB) 的多元回归分析。

回归.png 

4 观测到的地上生物量密度值与模型预测的地上生物量密度值

3)典型地物相似性搜索提取智能识别

人工智能兴起以来,从遥感影像上提取特定目标一直是遥感领域研究热门的之一。然而这一应用始终面临着样本需求量大、硬件设施要求高、数据量大、模型部署困难等众多难点。

AlphaEarth Foundations嵌入数据集的相似性搜索功能使得我们非常完美的克服了上述问题。

嵌入提供了一个独特的机会,让您可以使用地球观测数据找到相似的位置和特征。通过将参考位置的嵌入向量与嵌入图片的所有其他像素的嵌入向量进行比较,我们可以找到与参考位置具有相似属性的位置。在实践中,这使我们能够轻松找到感兴趣区域中的对象或特定类型的地点。

即使只使用2-3个样本,使用AlphaEarth Foundations嵌入数据集也可以非常简单的找出特定范围内相似目标。避免了海量的样本库、昂贵的服务器和复杂的AI算法模型。

谷仓提取.jpg 

5利用3个样本(紫色)预测的粮仓位置


版权所有 Copyright © 2013-2023 北京智行图新科技有限公司 京ICP备15049929号-1  站长统计