自监督预训练 - Tag - 堂堂一跑堂

MA3E：让遥感预训练\"看见\"角度——基于掩码角度感知自编码器的旋转不变表示学习

Mon, 01 Jun 2026 12:00:00 +0800

论文解读 | ECCV 2024 | 2026-06-01

项目	内容
标题	Masked Angle-Aware Autoencoder for Remote Sensing Images
作者	Benesaki Takam, et al.
会议	ECCV 2024
arXiv	-
GitHub	https://github.com/benesakitam/MA3E
关键词	自监督预训练、掩码自编码器、角度感知、旋转不变性、遥感图像

遥感图像与自然图像存在本质差异：同一地物在不同拍摄角度下会呈现完全不同的视觉外观。例如，一栋建筑物从东南方向和西北方向拍摄，其外观可能截然不同。这种旋转变化是遥感图像的固有特性。

现有的自监督预训练方法（如MAE、SatMAE等）主要借鉴自然图像的预训练策略，忽略了遥感图像中普遍存在的角度变化问题：

如何在自监督预训练中显式地感知和学习遥感图像中的角度信息，从而获得旋转不变的特征表示？

设计动机：遥感图像中的地物可能以任意角度出现，需要模型能够感知并适应这种角度变化。

具体实现：

Mon, 01 Jun 2026 12:00:00 +0800

论文解读 | IEEE TPAMI 2025 (IF=20.8) | ESI高被引论文

项目	内容
标题	HyperSIGMA: Hyperspectral Intelligence Comprehension Foundation Model
作者	Di Wang, Meiqi Hu, Yao Jin, Yuchun Miao, Jiaqi Yang, Yichu Xu 等（武汉大学、重庆大学、东京大学、南洋理工大学）
会议/期刊	IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025
arXiv	https://arxiv.org/abs/2406.11519
GitHub	https://github.com/WHU-Sigma/HyperSIGMA (⭐366)
关键词	高光谱图像、基础模型、Vision Transformer、稀疏采样注意力、自监督预训练

论文类型：理论突破型
创新性评分：⭐⭐⭐⭐ (4分)
判断依据：
1. 首创性：全球首个专门为高光谱图像设计的十亿级基础模型，填补了该领域的空白
2. 技术贡献：提出稀疏采样注意力（SSA）机制，针对性解决高光谱数据的冗余问题
3. 数据贡献：构建全球最大高光谱预训练数据集HyperGlobal-450K（2000万+图像）
4. 荣誉认可：入选ESI Hot Paper和Highly Cited Paper，证明学术影响力

高光谱图像（Hyperspectral Image, HSI）是遥感领域的重要数据类型，能够捕获数百个连续光谱波段的信息，在矿物勘探、农业监测、环境评估等领域有广泛应用。然而，与普通RGB图像相比，高光谱图像面临独特的挑战：

Mon, 01 Jun 2026 12:00:00 +0800

论文解读 | WACV 2025 | 2026-06-01

项目	内容
标题	Denoising Diffusion Probabilistic Models as Feature Extractors for Change Detection
作者	Wele Gedara Chaminda Bandara, Nithin Gopalakrishnan Nair, Vishal M. Patel
会议	IEEE/CVF Winter Conference on Applications of Computer Vision (WACV) 2025
arXiv	https://arxiv.org/abs/2405.17641
GitHub	https://github.com/wgcban/ddpm-cd
关键词	遥感变化检测、扩散模型、自监督预训练、特征提取、DDPM

遥感变化检测（Change Detection, CD）是地球观测的核心任务之一，旨在从不同时相的遥感图像中识别地表变化。这项任务在城市规划、环境监测、灾害评估等领域有着广泛应用。

然而，现有的变化检测方法面临一个关键瓶颈：高质量标注数据的稀缺性。标注遥感图像的变化区域需要专业知识和大量时间，这限制了深度学习模型的性能提升。

如何利用海量无标注遥感图像提升变化检测模型的特征表示能力？

设计动机：扩散模型（DDPM）在图像生成任务中展现出强大的语义理解能力。作者观察到，预训练的扩散模型在去噪过程中学习到了丰富的图像语义特征，这些特征可以迁移到变化检测任务中。

具体实现：