CVPR2026 | F2Net: 悉尼大学等提出自适应频率分解用于高分辨率遥感影像语义分割

本文作者：陈淑瑜

2026-06-03 18:48

导语：基于自适应频率分解的多分支网络 F2Net，将超高分辨率遥感图像分解为高频与低频分量分别处理，兼顾细节保留与语义建模

来源：公众号“遥感与深度学习“
原文链接：https://mp.weixin.qq.com/s/2bONrB7za70sCN9b43H-ig?scene=1&click_id=34

题目：F2Net: A Frequency-Fused Network for Ultra-High Resolution Remote Sensing Segmentation
会议： The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026
论文： https://arxiv.org/abs/2506.07847
数据： DeepGlobe、Inria Aerial
年份： 2026 (本篇基于2025年6月arxiv版)
单位： 悉尼大学、阿德莱德大学、清华大学、埃迪斯科文大学

CVPR2026 遥感AI方向合集：CVPR2026

CVPR2026 | F2Net: 悉尼大学等提出自适应频率分解用于高分辨率遥感影像语义分割

创新点

提出基于自适应频率分解的多分支网络 F2Net，将超高分辨率遥感图像分解为高频与低频分量分别处理，兼顾细节保留与语义建模
设计混合频率融合模块（HFF），通过跨分支通道注意力实现高、低频特征的层次化自适应聚合
提出跨频率对齐损失（CFAL），利用对称 KL 散度约束高低频分支在语义层面保持一致性
提出跨频率平衡损失（CFBL），显式正则化各分支梯度范数，解决多分支联合训练中的梯度失衡问题

背景

超高分辨率（UHR）遥感图像语义分割在城市规划、环境监测等领域具有重要应用价值，但其极大的图像尺寸给现有分割网络带来严峻的计算挑战。传统方法通常采用下采样或裁块两种策略适配网络输入，前者丢失细粒度边界细节，后者破坏全局上下文一致性。

为此，学界提出多分支架构（如 GLNet、ISDNet）以同时保留局部细节与全局语义，但这类方法存在两个核心问题：一是分支内部计算效率低（如反复裁块推理），二是多分支并行训练引发梯度竞争，导致收敛不稳定与特征对齐困难。本文从频率域视角出发，通过将图像分解为高低频分量并为各分量设计专属分支，同时引入专用损失函数，系统性地解决上述问题。