0
| 本文作者: 陈淑瑜 | 2026-06-01 11:54 |
距CVPR 2026正式开幕(6月3日)仅剩两天,论文信息进入最后冲刺阶段。
本期三大爆点同日引爆:浙大&蚂蚁联合团队凭借HTD-Refine杀入Oral最佳论文候选,用高阶动力学对齐一举攻克单目人体动作恢复的"滑步+抖动"顽疾,成为本期国内团队最强信号;动态高斯重建方向,ClipGStream以"流式"架构首次同时拿下大运动+长序列,代码同步开源可直接复现;非视距感知赛道迎来标志性时刻——DENALI数据集与毫米波雷达GeRaF同时摘得Highlight,视觉×雷达双路线打通,NLOS从实验室概念正式迈入工程化。以下三大议题,带你在开幕前夜锁定最值得持续跟踪的技术脉搏。
热门议题一:浙大&蚂蚁Oral候选!高阶动力学对齐终结单目动作恢复的「滑步」顽疾
单目视频中的人体动作恢复是计算机视觉长期未解的难题——哪怕模型整体效果不错,脚底「滑步」和关节「抖动」依然如影随形,严重制约了在数字人、影视制作和康复医学中的实际落地。浙江大学与蚂蚁集团联合团队提出HTD-Refine,从高阶时序动力学入手,在机制层面根治了这一顽疾。更重要的是,它不仅被CVPR 2026接收为Oral,还同时入选最佳论文候选(Award Candidate)——这一双重认证在CVPR数千篇投稿中极为罕见,是本届中国团队至今最强的成绩信号。
HTD-Refine: High-order Temporal Dynamics Refinement for Monocular Human Motion Recovery(CVPR 2026 Oral & Award Candidate)
浙江大学与蚂蚁集团联合提出HTD-Refine,针对单目视频人体动作恢复中普遍存在的"滑步"(foot sliding)和"抖动"(jittering)问题,通过引入高阶时序动力学对齐(High-order Temporal Dynamics Alignment)机制,从根本上提升了动作恢复的自然度与时序稳定性。该论文入选CVPR 2026 Oral,并同时获得最佳论文候选(Award Candidate)认定,是本届会议中国团队的最强成果之一,在动作捕捉、数字人生成及康复医学辅助等产业方向具有重要应用价值。
论文/原文链接:https://mp.weixin.qq.com/s/zw_R86_cL48P-IEwE3PJfw
热门议题二:4D重建新SOTA已开源!ClipGStream首次同时征服大运动与长序列
动态场景的4D重建(3D空间×时间维度)长期面临一个两难困境:要么处理得了大幅度运动、要么撑得住长时序序列,两者往往不可兼得。ClipGStream用"流式高斯表示"(Streaming Gaussian Representation)架构打破了这一瓶颈,在基准数据集上达到新SOTA的同时,代码与权重已经全部开源——这意味着研究者可以立即复现和扩展。对于数字人制作、游戏引擎实时渲染以及自动驾驶场景感知而言,这项突破的产业转化窗口已经打开。
ClipGStream: Streaming Gaussian Representation for Dynamic 4D Reconstruction(CVPR 2026,已开源)
ClipGStream由「我爱计算机视觉」公众号重点推荐,是首个同时支持大范围运动(Large Motion)和长时序序列(Long Sequence)的4D重建框架。核心创新在于流式高斯表示(Streaming Gaussian Representation),突破了现有4D高斯方法在运动幅度与序列长度上的二选一限制,在动态场景重建基准上达到新SOTA。代码与权重已同步开源,可在数字人生成、游戏引擎渲染及自动驾驶场景感知中直接落地验证。
论文/原文链接:https://mp.weixin.qq.com/s/boFZV3ANqEX5c-TJQ7KNCw
热门议题三:非视距感知双Highlight同日引爆!视觉数据集×毫米波雷达双路线打通
非视距感知(NLOS,Non-Line-of-Sight)——即"看见你看不见的东西"——一直被视为计算机视觉最前沿也最难工程化的方向之一。而本届CVPR 2026,这个方向罕见地同时收获两篇Highlight:DENALI提供了首个支持NLOS空间推理的大规模视觉数据集,标志着该领域从"有想法"迈入"有数据"的关键拐点;GeRaF则从另一路线出发,用毫米波雷达穿透纸箱障碍物实现3D表面重建,把NLOS能力从实验室原型推向实际工程场景。视觉+雷达双Highlight同时落地,意味着NLOS感知正在从单一技术路线走向系统性突破。
DENALI: A Large-Scale Dataset for Non-Line-of-Sight Spatial Reasoning(CVPR 2026 Highlight)
DENALI是首个专为非视距(Non-Line-of-Sight, NLOS)空间推理设计的大规模数据集,为NLOS感知研究提供了系统性基础设施。该数据集的发布标志着NLOS方向从单一实验性研究走向数据驱动的工程化阶段,填补了NLOS空间推理领域长期缺乏标准训练与评测平台的空白,获CVPR 2026 Highlight认定。
GeRaF: Geometry-aware Radar Fusion for NLOS 3D Surface Reconstruction(CVPR 2026 Highlight)
GeRaF利用毫米波(mmWave)雷达的穿透特性,对被纸箱等障碍物遮挡的目标进行非视距3D表面重建,将NLOS感知能力从视觉单路线拓展至雷达融合路线。与DENALI形成"数据集奠基+雷达工程化"的协同突破,两篇论文同获CVPR 2026 Highlight,共同标志着NLOS感知技术走向实际工程部署的临界点。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
更多CVPR 2026深度资讯,欢迎关注【CVPR 2026专区】 我们将持续跟踪
CVPR 2026 正式开幕(6月3日)在即—— 每日一报,不漏一篇,陪你锁定视觉智能最前沿。
雷峰网(公众号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。