明天开幕！浙大蚂蚁Oral候选+一人双Highlight，CVPR前夜终极大爆发

本文作者：陈淑瑜

2026-06-02 15:37

导语：开幕前夜终爆：Oral候选+一人双Highlight+4D重建

距CVPR 2026正式开幕（6月3日）仅剩最后一天，本期是临会前最后一期日报——信息密度拉满。

三大核心信号同时亮起：浙大与蚂蚁联合团队的HTD-Refine确认Oral + Best Paper Candidate双重身份，高阶动力学对齐彻底终结单目人体动作恢复的"滑步+抖动"，成为中国团队本届最强成绩；密歇根大学Nikhil Behari一人独揽两篇Highlight——DENALI（低功耗LiDAR非视距推理数据集）与Task-Driven Implicit（LiDAR系统自动化设计），同一作者双Highlight在CVPR极为罕见；PackUV以85赞拿下本期最高互动，前馈4D重建的体素化全量视频表示继续为3D方向续火。

以下三大议题，带你在开幕前夜完成最后一轮火力校准。

热门议题一：浙大&蚂蚁Oral候选确认！Best Paper Candidate双重认证，中国团队本届最强信号

单目视频的人体动作恢复长期被"滑步"和"抖动"两大顽疾困扰，直接制约了数字人、虚拟试衣和康复医学的落地。HTD-Refine从高阶时序动力学入手，直接对齐速度和加速度而非传统位置对齐，在机制层面根治了这一痛点。更关键的是，它同时拿下Oral和Best Paper Candidate——这种双重认证在CVPR数千篇投稿中凤毛麟角，也是蚂蚁集团与浙大产学研合作的标杆性成果。国内媒体「我爱计算机视觉」和「AI前沿速递」同日报道，快讯价值已经就位。

HTD-Refine: High-order Temporal Dynamics Refinement for Monocular Human Motion Recovery（CVPR 2026 Oral & Best Paper Candidate）

浙江大学与蚂蚁集团联合提出HTD-Refine，针对单目视频人体动作恢复中长期存在的"滑步"（foot skating）和"抖动"（jittering）问题，创新性地引入高阶时序动力学对齐——直接对齐速度和加速度而非传统的位置对齐，从根本上提升了动作恢复的自然度与时序稳定性。论文同时获得CVPR 2026 Oral认定和Best Paper Candidate（最佳论文候选）资格，是本届会议中国团队的最强成果，在动作捕捉、数字人生成及康复医学等产业方向具有极高应用价值。

论文/原文链接：https://mp.weixin.qq.com/s/zw_R86_cL48P-IEwE3PJfw

热门议题二：一人双Highlight！密歇根Nikhil Behari独揽LiDAR感知两席，非视距推理×自动化设计双突破

在CVPR 2026数千篇投稿中，同一位作者同时拿下两篇Highlight的概率极低——密歇根大学的Nikhil Behari做到了。DENALI构建了首个低功耗LiDAR非视距空间推理数据集，把NLOS从"烧钱的高功率设备"拉到低成本LiDAR即可运行的现实层面；Task-Driven Implicit Representations则从系统设计角度出发，用隐式表示自动化LiDAR感知管线的构建流程。两篇论文一"数据"一"系统"，共同将LiDAR感知方向推向了工程化临界点。40赞/4.9K views的互动也印证了社区对这一方向的高度关注。

DENALI: Low-Power LiDAR Non-Line-of-Sight Spatial Reasoning Dataset（CVPR 2026 Highlight）

密歇根大学Nikhil Behari提出DENALI，首个面向低功耗LiDAR的非视距（Non-Line-of-Sight）空间推理大规模数据集。该数据集将NLOS感知从依赖昂贵高功率设备的实验室场景，拓展至低成本LiDAR即可部署的现实应用，标志着NLOS感知从学术概念走向工程化的关键拐点。获CVPR 2026 Highlight认定。

论文/原文链接：https://x.com/NikhilBehari/status/2061078776595775760

Task-Driven Implicit Representations for Automated LiDAR System Design（CVPR 2026 Highlight）

Nikhil Behari同期另一篇Highlight论文，提出任务驱动的隐式表示方法，实现LiDAR感知系统的自动化设计。与DENALI形成"数据基建+系统自动化"的协同突破，两篇Highlight共同将LiDAR感知方向推向工程化部署阶段。

论文/原文链接：https://x.com/NikhilBehari/status/2061078776595775760

热门议题三：85赞最高互动！PackUV前馈4D重建续火，RLFTSim Highlight为自动驾驶仿真开新路

本期推文互动王属于PackUV——85赞/5.2K views，在临会期"I'm heading to CVPR"刷屏的背景下尤为突出。PackUV用体素化全量视频表示实现前馈4D重建，延续了3D/4D方向在本届CVPR的持续高热度。与此同时，RLFTSim以Highlight身份为自动驾驶仿真开辟新范式——用强化学习微调生成真实可控的多智能体交通场景，直接服务于自动驾驶训练的数据瓶颈问题。一"重建"一"仿真"，3D视觉与自动驾驶在本期形成了明确的交叉共振。

PackUV: Feed-Forward 4D Reconstruction with Volumetric Video Representation

Anushka Agarwal提出PackUV，一种面向4D视觉的前馈重建方法，支持全量视频的体素化表示。以85赞/5.2K views成为本期最高互动推文，在feed-forward 4D重建方向延续了3D/4D Gaussian Splatting在本届CVPR的持续高热度，为动态场景的高效重建提供了新的技术路线。

论文/原文链接：https://x.com/_anushkaagarwal/status/2060874508962050220

RLFTSim: Reinforcement Learning Fine-Tuned Simulation for Multi-Agent Traffic（CVPR 2026 Highlight）

Ehsan Ahmadi等人提出RLFTSim，通过强化学习微调生成真实可控的多智能体交通仿真场景，获CVPR 2026 Highlight认定。该方法直接服务于自动驾驶训练中的数据瓶颈问题——传统仿真器生成的数据往往缺乏真实感和可控性，RL微调后的仿真在保真度和可控性上实现了显著提升。

论文/原文链接：https://x.com/ehsana94/status/2061499006539219351

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

更多CVPR 2026深度资讯，欢迎关注【CVPR 2026专区】明日（6/3）CVPR 2026正式开幕，我们将切换会中实时模式：

·Best Paper Award 第一时间追踪 · Keynote 核心观点速递 · 中国机构 / 中国厂商现场直击 · Oral & Highlight 论文现场速读 · Side Event & Workshop 亮点集锦

每日一报，不漏一篇——陪你全程锁定视觉智能最前沿。

雷峰网(公众号：雷峰网)

雷峰网原创文章，未经授权禁止转载。详情见转载须知。