您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
人工智能 正文
发私信给陈淑瑜
发送

0

CVPR 2026 日报 |D4RT拿下最佳论文,Oxford VGG背靠背封神,Keynote掀起「视觉还是不是视觉」之争

本文作者: 陈淑瑜   2026-06-09 15:25
导语:D4RT封神,VGG背靠背,视觉范式之争燃爆全场

CVPR 2026已于6月7日在丹佛正式闭幕,本期为「后CVPR时代」首份日报。最佳论文D4RT(Google DeepMind+Oxford VGG)200+ FPS实时4D动态重建持续刷屏;Oxford VGG凭VGGT和D4RT实现背靠背最佳论文两连冠;Thomas Serre一句「我们是否偏离了视觉的本质」Keynote引爆学界反思。三大话题,一文读懂后CVPR最强回响。

 

今日热门议题热门议题一:D4RT斩获CVPR最佳论文,Oxford VGG背靠背封神

一个Transformer,一次前向传播,200帧每秒实时重建动态场景——D4RT拿下CVPR 2026最佳论文。更绝的是:Oxford VGG去年凭VGGT拿下最佳论文,今年D4RT再度登顶,背靠背两连冠震动整个社区。

论文:D4RT: Efficiently Reconstructing Dynamic Scenes One D4RT at a Time

来源:X/Twitter @GoogleResearch

日期:2026-06-08

论文摘要

D4RT由Google DeepMind与Oxford VGG联合提出,基于单一Transformer架构实现4D动态场景重建,达到200+ FPS的实时重建速度。论文发表后在社区持续发酵,Google Research官方推文获457❤️/30K+浏览量。Oxford VGG去年以VGGT(三维重建)获CVPR 2025最佳论文,今年延续三维视觉路线拿下D4RT(4D动态重建),实现背靠背最佳论文两连冠,成为CVPR 2026最具标志性的学术事件之一。

原文链接: https://x.com/GoogleResearch/status/2063686164662628579

D4RT中文解读: https://mp.weixin.qq.com/s/kIWr4LaHcrYH1Aj3yb4K7w

 CVPR 2026 日报 |D4RT拿下最佳论文,Oxford VGG背靠背封神,Keynote掀起「视觉还是不是视觉」之争

热门议题二:具身智能暴涨五倍,「我来时爱生成,走时爱机械臂」

「我带着对生成模型的兴奋来CVPR,走的时候对机械臂动了感情。」——研究者Pinar Yanardag的这条推文,侧写了具身智能在CVPR 2026上的真实存在感。CVer等公众号数据证实:VLA/具身智能论文数量暴涨五倍,已成本届CVPR最显著的结构性趋势。

来源:CVer / 极市平台 / X/Twitter @PINguAR

日期:2026-06-07~08

核心信息

CVer等多篇公众号从不同维度报道了具身智能在CVPR 2026的「屠榜」表现:VLA/机器人操作论文数量暴涨五倍,Embodied AI、ScaleBot等Workshop场场爆满。Pinar Yanardag(GEMLAB,4篇CVPR论文)发推表示参会前关注生成模型、离会时却「对机械臂动了感情」,引发广泛共鸣。从大会方向统计来看,具身智能相关赛道已与图像合成、视觉语言推理并列为CVPR 2026三大绝对热点。

具身屠榜原文: https://mp.weixin.qq.com/s/OiCdHSCcBK_vVAptx0ilkQ

Pinar推文原文: https://x.com/PINguAR/status/2064023129748304210

 

热门议题三:Serre Keynote引爆反思——Scaling Law之后,视觉还是不是视觉?

「近年来最佳Keynote。」多位学者在推特上如此评价Thomas Serre(布朗大学)的压轴演讲。他提出:在Scaling Law主导AI发展的今天,计算机视觉是否已经偏离了理解视觉感知的本质?这场演讲被认为可能影响下一阶段研究范式的走向。

演讲:Scaling Laws vs Neural Laws(Thomas Serre,布朗大学)

来源:X/Twitter @anand_bhattad / @abursuc

日期:2026-06-07

核心信息

布朗大学Thomas Serre在CVPR 2026发表主题演讲「Scaling Laws vs Neural Laws」,探讨在大规模语言与视觉模型主导的时代,计算机视觉研究是否应当回归神经科学根基——重新理解人类视觉感知的机制,而非只追求更大的模型和更多的数据。多位学者在会后发推表示这是「近年来听过最好的Keynote之一」,认为其论点对下一阶段视觉研究方向有潜在影响。Andrei Bursuc等人转发引发社区广泛讨论。

Anand Bhattad推文: https://x.com/anand_bhattad/status/2063682753661706536

Andrei Bursuc推文: https://x.com/abursuc/status/2063662047141789899

 CVPR 2026 日报 |D4RT拿下最佳论文,Oxford VGG背靠背封神,Keynote掀起「视觉还是不是视觉」之争

关注本专区,雷峰网(公众号:雷峰网)每日追踪CVPR 2026最新论文与热点趋势

更多CVPR现场快讯、深度解读与选题建议,每日准时送达。 收藏关注,不错过任何一篇值得读的论文。


雷峰网原创文章,未经授权禁止转载。详情见转载须知

CVPR 2026 日报 |D4RT拿下最佳论文,Oxford VGG背靠背封神,Keynote掀起「视觉还是不是视觉」之争

分享:
相关文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说