0
| 本文作者: 陈淑瑜 | 2026-06-04 14:43 |
CVPR 2026丹佛会期进入第三天,三大趋势浮出水面:无监督视觉表征打破光流SOTA、视觉语言导航首次进入自动驾驶、具身智能论文量暴增全面屠榜。本期日报精选三个最热方向,带你一文看尽今日CVPR高光时刻。
以下为本日社区关注度最高的三个核心议题,按热度排序,均附论文摘要与原文链接,方便快速研判与选题跟进。
热门议题一:无监督光流首获Oral,U2Flow KITTI封神
当监督学习还在为标注成本发愁,中山大学团队用纯无监督方式直接刷新光流SOTA。Oral论文+开源代码+KITTI登顶——这个组合让整个社区为之一振。
论文:U2Flow: 首个递归无监督光流框架
来源:我爱计算机视觉
日期:2026-06-03
分级:S级(Oral论文)
论文摘要
中山大学(联合华中科技大学)提出U2Flow,首个将递归结构与不确定性估计结合的无监督光流框架。核心创新:①不确定性估计头在递归更新块内预测像素级不确定性;②增强一致性无监督学习策略,利用数据增强训练模型自我评估预测质量;③解耦学习策略保证联合训练稳定性。性能:KITTI-2015 Fl-all 6.00%(超越所有无监督SOTA),参数量仅5.22M,RTX 3090上15 FPS。已开源:github.com/sunzunyi/U2FLOW
原文链接: https://mp.weixin.qq.com/s/KmQn73epN6nGJP9XQJqUOw
热门议题二:VLN杀入自动驾驶,DriveVLN不带地图也精准停车
不需要高精地图,靠一句自然语言指令就能把车开进地下停车位——澳门大学与千里科技联手,让视觉语言导航从室内走向真实道路,98.61%的准确率直接把GPT-5甩在身后。
论文:DriveVLN: 无地图自动驾驶视觉语言导航
来源:CVer
日期:2026-06-03
分级:A级(范式突破)
论文摘要
澳门大学智慧城市物联网国家重点实验室联合千里科技(Afari)提出DriveVLN,将视觉语言导航从室内机器人迁移至自动驾驶。创新:双分支架构——DiffusionDrive扩散模型规划器生成候选轨迹 + 微调Qwen2.5-VL-3B多模态选择器基于目的地指令选最优路径。两阶段训练:SFT+GRPO强化学习。实测:地下停车场车位到达准确率98.61%,大幅超越GPT-5(81.89%)。论文已发布于CVPR Open Access。
原文链接: https://mp.weixin.qq.com/s/dvL8H5uIo-uV8WJ3yEDNiQ
热门议题三:具身智能屠榜CVPR,VLA论文量暴增成新王
从Detection到Embodied,CVPR的年度关键词正在发生质变。VLA论文暴增、机器人操作成为最热方向、Sim2Real从加分项变刚需——具身智能正在重新定义计算机视觉的边界。
分析来源:CVer(定性研判)
日期:2026-06-03
热度:?持续高热(社区级共识)
核心观点
CVer定性指出VLA论文数量暴增、机器人操作成热点、Sim2Real成为刚需,关键词从传统的Detection/Segmentation转向Embodied/Policy/Interaction。多位CVer推文证实具身智能为CVPR 2026最热门方向,VLA论文量持续增长。此外,机器之心将于6月7日在丹佛现场举办"具身智能与物理世界"专场直播,进一步印证这一趋势。
查看全文: https://mp.weixin.qq.com/s/TBvjugVHaRrUpWbpYJqY0w
机器之心直播: https://mp.weixin.qq.com/s/aeck-p3ka9fSugiZsiL17Q
雷峰网(公众号:雷峰网)
关注本专区,每日追踪CVPR 2026最新论文与热点趋势
更多CVPR现场快讯、深度解读与选题建议,每日准时送达。 收藏关注,不错过任何一篇值得读的论文。
内容由AI辅助生成,请谨慎参考 | CVPR 2026 Hot Daily
雷峰网原创文章,未经授权禁止转载。详情见转载须知。