0
| 本文作者: 陈淑瑜 | 2026-05-28 10:46 |
来源:公众号“遥感与深度学习“
原文链接:https://mp.weixin.qq.com/s/ojm6yRWRURFIL1UlD9ZwPw?scene=1&click_id=138
题目:Prompt-Free Universal Region Proposal Network
会议:The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026
论文: https://arxiv.org/abs/2603.17554
数据: CD-FSOD benchmark、ODinW13 benchmark,共19个数据集
代码: https://github.com/tangqh03/PF-RPN
年份: 2026
单位: 南京大学、中国科学技术大学
CVPR2026 遥感AI方向合集:CVPR2026
现有目标检测中的区域候选网络(RPN)在面对未见域时泛化能力不足,难以识别未知类别目标。开放词汇目标检测(OVD)方法虽具备一定泛化能力,但通常依赖类别名称或样例图像作为提示输入,在工业缺陷检测、水下目标检测等实际场景中提示信息往往不可获取,限制了其灵活性。
部分无提示OVD方法尝试借助生成式视觉语言大模型(VLM)自动生成描述以消除手动提示的依赖,但此类方法引入了显著的内存和推理延迟开销。因此,亟需一种高效的区域候选网络,能够在无任何外部提示的条件下跨域泛化,直接应用于多种下游检测任务。
PF-RPN基于Grounding DINO构建,以可学习嵌入替代文本嵌入,通过纯视觉特征生成目标候选框,无需任何文本或图像提示。图像编码器提取多层次特征图后,依次经过SIA模块、CSP模块和CG-QS模块,最终输出高质量目标候选框。

PF-RPN在CD-FSOD和ODinW13共19个跨域数据集上均显著超越现有OVD模型、传统RPN及多模态大语言模型,展现出强大的零样本跨域泛化能力。此外,与同类无提示方法相比,PF-RPN在大幅提升检测性能的同时,推理速度和显存占用均具有明显优势,具备更高的实际部署价值。在遥感场景下,PF-RPN在DIOR数据集上同样取得了最优性能,显著领先于GLIP、YOLOE、YOLOWorld等对比方法,验证了其在遥感图像目标定位任务中的有效性。




雷峰网版权文章,未经授权禁止转载。详情见转载须知。