您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
业界 正文
发私信给齐铖湧
发送

0

击败PI ,清华系具身公司包揽「具身奥林匹克」三项全球第一,刷新世界纪录!

本文作者: 齐铖湧   2026-04-14 10:37
导语:具身领域的"张雪机车"出现了。


据AI科技评论获悉,在刚刚结束的全球具身灵巧操作难度顶尖的真机赛事——Benjie's Humanoid Olympic Games(以下简称Benjie's Olympics)中,来自中国的具身智能头部公司星动纪元,凭借自研具身智能模型,一举斩获三项任务全球第一,创下新世界纪录。

击败PI ,清华系具身公司包揽「具身奥林匹克」三项全球第一,刷新世界纪录!

三大核心任务,均获第一,收获三张冠军奖牌

这次获奖的意义,不仅在于这是中国企业首次在该赛事中登顶,更关键的是,它在三项核心任务中,以显著优势击败了被誉为"全球最强具身大脑公司之一"的Physical Intelligence(简称PI)。

要理解这场胜利的含金量,必须先从具身领域的"莫拉维克悖论"说起。

2015年,PI曾在官方技术博客介绍这一悖论:"当计算机在1996年击败国际象棋世界冠军时,它仍需要人类来移动棋子;二十年后AlphaGo战胜李世石,依然无法自己落子。"

PI想表达的,正是一个非常反直觉的现象:对人类而言"困难"的高阶认知任务(如下棋、解数学题),对AI来说相对"容易";而人类习以为常的日常感知与动作(如叠衣服、用钥匙开锁、剥橘子),对机器人却是极高难度的挑战。

过去十年,很多具身公司一直致力于打破这一悖论。但摆在大家面前的,有三大难题:第一是柔性物体操作,比如遇上布料、果皮、软质食材的复杂形变,机器人往往很难控制;第二是类似于钥匙与锁孔对准这类毫米级精密交互;第三是一些有着多步骤的长时序自主任务。

这些任务往往细致而复杂,既要做控制毫米级的感知误差或控制误差,又要有非常复杂的流程,任何一个细节出错,都会导致整个任务链条的崩溃。

在2026年的当下,虽然你可能在各家发布会或者展会现场,能看到非常细致或者长流程的操作,但大多数仍是精心编排的"视频可用"表演:固定场景、预设光照、人工遥控、仿真环境。

行业现状一句话概括来说就是"Demo泛滥,落地稀缺"。

如何真正突破这些瓶颈?在于接受最严苛的检验:全自主、零人工干预、拒绝仿真、真实物理环境。

于是,Benjie's Olympics这样的比赛横空出世。

01

"刻薄"的机器人赛事和它的常驻冠军

Benjie's Olympics由前Google资深机器人专家Benjie Holson创办,它的评价体系非常"刻薄",被《科学美国人》(Scientific American)杂志评价为"人形机器人终极挑战"。

据AI科技评论了解,这一届赛事共设置15项实战挑战,从基础操作到复杂精细动作,按难度等级分为金牌、银牌、铜牌任务。

其中,开锁、剥橘子属于最难的金牌任务;翻袜子属于银牌任务。赛事规则堪称"闭卷裸考":全自主运行,开始后无遥控、无人工介入;必须在真实家庭场景(真实光照、纹理、摩擦、噪声)中完成;环境/物体随机摆放,不可贴标记、不可预扫描地图;要求多次重复稳定完成,而非"赌运气成功"。

赛前,赛事创始人曾预测,完成全部挑战至少需要1年。另一位参赛团队反馈:"我们花6个月做Demo;在Benjie的任务上3天90%失败。真实世界毫不留情。"

和大多数可以刷的榜单不同,这个赛事是国际上最硬核的赛事之一。参与评审的评委提到:"这是唯一强制泛化而非复现的比赛。多数队伍连铜牌都过不了;金牌近乎奇迹。"

因此,这个赛事的底色就是残酷而真实,但却极具公信力。也正是因为权威、真实且具有公信力,所以吸引了PI成为这个赛事的常驻选手。

PI的全称是Physical Intelligence。作为具身行业前辈,它拥有着现阶段全球最强具身大脑,这家斯坦福系、融资近20亿美元的公司,几乎是行业里教科书般的存在。

2024年10月,这家公司发布了π0具身智能基座模型,一度被业界认为是具身领域的GPT时刻。它的技术路线和研究成果,都是同行们紧紧盯着的。之所以如此被业界认可,正是因为PI长期把持着前面提到的Benjie's Olympics赛事的各项纪录。

据AI科技评论了解,这几乎是唯一一个PI自己会主动参加的榜单。其他榜单里的PI,大多是别人拉着PI的开源模型去跑的,并不是PI主动参加。

而这一次,来自中国的星动纪元杀入,不仅成为第一个在该项赛事上榜的中国公司,更一举拿下三项第一,把PI的纪录全部刷新。

据AI科技评论深度对比,还发现一个细节:这次PI参赛用的是自家最新模型——闭源模型PI0.6,这意味着代表了PI的最高水平。这次星动纪元在这样的赛事中打败了PI的最新闭源模型,这件事在之前从来没有人做到过。

在某种意义上,星动纪元这次在Benjie's Olympics上的突破,与张雪机车刚在WSBK夺冠有着类似的意义。

击败PI ,清华系具身公司包揽「具身奥林匹克」三项全球第一,刷新世界纪录!


后者作为2024年才创立的中国品牌,首次杀入世界超级摩托车锦标赛便连夺两冠,打破欧美日厂商37年垄断。

而星动纪元,则是以清华大学年轻博导陈建宇创立的国内原生具身创业公司为班底,在国际赛场上打破了国外垄断。

02

夺冠细节

AI科技评论也详细扒了一下这次赛事的细节,最精彩的赛事分别是剥橘子、开锁以及翻袜子的比拼。

先说剥橘子。这是本次赛事中最具看点的金牌任务。简单科普一下:机器人剥橘子,要求机器人能精准区分果皮与果肉的细微视觉特征,实时跟踪剥制过程中的果皮形变,对视觉感知的鲁棒性要求极高。

更困难的是,橘子属于柔性+形变物体,果皮与果肉之间的粘附力不均匀,剥制过程中果皮会发生复杂、无规律的形变,需要机器人实时调整操作策略。

这个任务,PI团队选择了借助削皮刀工具剥,用时2分46秒完成。

而星动纪元的具身大脑,直接选择了无工具纯手剥。不仅是赛事首个实现完全无工具纯手剥操作的团队,而且纯手剥只用了1分47秒完成——比PI操作更难,速度居然还比PI提升35%。

有参赛选手反馈,当星动纪元团队完成,赛事现场简直一片炸裂。这不仅体现了中国团队在柔性物体操作上的优势,更展示了VLA模型对工具使用vs徒手操作的灵活决策能力——当PI依赖外部工具时,星动纪元的机器人已经能够像人类一样,仅凭双手完成精细操作。

第二个比赛是开锁。这也同样是一个看点十足的金牌任务。

在这个场景的比拼,主要在于钥匙孔为毫米级微小目标,要求机器人精准识别钥匙孔的位置、角度,同时完成钥匙的姿态理解,实现毫米级对准。此外,开锁过程中需要克服光照变化、金属反光、视角偏差等多重干扰,对视觉感知的精度与鲁棒性要求严苛。

这在具身场景里属于典型的"高接触操作"——钥匙与锁孔之间的接触力必须精确控制,过轻则无法转动,过重则可能损坏锁芯。

同样是开锁,PI 66秒开锁,而星动纪元只花了49秒就成功开锁。

耗时少了四分之一的关键,在于我们国家的具身团队,在自适应视觉注意力机制的工程优化方面非常到位。这个机制实现了对钥匙、锁孔等微小目标的动态聚焦与特征增强,显著提升了精细操作对象的感知精度,才能在毫米级操作下,做到如此快速准确。

第三个比赛是翻袜子。虽然属于银牌任务,但是却考验的是柔性物体操作、样本泛化、效率敏感的典型场景,这对于检验模型家用泛化能力非常关键。

袜子翻转过程中会发生复杂、无规律的形变,要求机器人实时跟踪形变,精准区分袜子的内外侧、开口位置,对视觉感知、柔性物体跟踪能力要求极高。

比赛结果:PI的成绩是1分33秒完成,176个样本训练。而星动纪元只用了1分04秒和120个样本——相当于样本数减少32%的前提下,速度提升了30%。  

对于了解具身模型训练的朋友会知道,这里的含金量在于"小样本泛化能力"。星动纪元通过基础模型的知识迁移,用更少的数据达到了更优的性能,大幅提升了数据利用效率。在真实商业场景中,这意味着更低的部署成本和更快的场景适配速度。

03

夺冠之前

像张雪机车在WSBK夺冠那样,星动纪元这次在国际大赛上击败PI,不是凭借运气,而是厚积薄发。

星动纪元的创始人陈建宇,出生于1992年,是清华大学交叉信息研究院最年轻的博导之一。2015年,陈建宇从清华精密仪器系本科毕业——这是国内最早啃双足机器人硬骨头的地方——之后直博进入伯克利,师从Tomizuka——MPC模型预测控制理论的奠基人,机电控制领域的活化石。

2020年博士毕业,图灵奖得主姚期智亲自把他从国外捞回国,进入清华任教。

次年,陈建宇入选福布斯30 Under 30。2023年8月,星动纪元成立。作为清华交叉信息研究院孵化、唯一一家清华占股的人形机器人公司,星动纪元从Day One就定调:软硬一体,全栈自研。不是做集成商,是要把"具身大脑"和"人形本体"都攥在自己手里。

关节模组、灵巧手、电机、减速器、控制器,从零件到整机,95%自己造。

此后,星动纪元不断刷新自己的记录。2024年5月,造了一台1.65米高的机器人XBOT,成了第一个登上长城的人形机器人。

之后,又凭借着自研的灵巧手出圈。不久前,星动纪元研发出了ERA-42——这个可实现全尺寸双足人形机器人全身及五指灵巧手精准控制的系统,全球仅有四款,另外三家分别来自Figure、特斯拉与英伟达。

2026年2月,陈建宇团队与Chelsea Finn团队联合研发的Ctrl-World可控生成世界模型,已在WorldArena榜单中超越谷歌、英伟达,斩获具身任务全球第一。

2026年3月,双方再度合作发布VLAW框架,首次实现VLA策略与动作条件世界模型的协同迭代优化——VLA策略采集的真实交互数据用于提升世界模型的物理保真度;世界模型生成的高质量虚拟数据再用于强化VLA策略本身。

在全球巨头与顶尖机构同台竞技,星动纪元已经多次显露锋芒。

这种"虚实融合"的训练范式,解决了传统VLA模型数据利用率低、泛化性有限的痛点。陈建宇在接受媒体采访时提到:"传统VLA模型不管物理世界的运转逻辑,它只知道'看到电脑就该打开'。而世界模型学的是'如果我手这样伸过来一抠,电脑可能会被打开'。"

那时,陈建宇和星动纪元已经在着手一个巨大的奇迹。

但还需要工程方面的加持。在工程层面,星动纪元在无数次试炼中,提炼出了一套方法论:"异步高频推理"+"短时域规划策略"。

在当前运动轨迹未执行完成时,系统就预测下一段轨迹,生成后立即切换执行。这种"边做边想"的架构,大幅提升了机器人对非预期扰动的实时响应能力,有效抑制了累计动作误差。

在模型和工程能力的双重突破下,星动纪元才实现了中国具身智能的"工业级"跃迁。

击败PI ,清华系具身公司包揽「具身奥林匹克」三项全球第一,刷新世界纪录!

此次斩获Benjie's Olympics三项全球第一,是星动纪元在具身模型领域的又一重大突破。此前,其自研的ERA-42端到端VLA具身大模型已在物流、制造、商业服务等多个领域落地,形成了"场景越丰富,模型越智能"的正向循环。(雷峰网)

在物流领域,星动纪元机器人可完成药品、日化品、包裹的分拣及扫码;在制造领域,重点突破"零部件抓取-高精度装配-质量检测"等场景任务;在商业服务领域,可完成门店客座清洁、物品递送、导游导览等任务,部分场景效率已达人类水平的70%。

更具战略意义的是,星动纪元是全球仅有的四家能实现全尺寸人形机器人全身及五指灵巧手精准控制的公司之一,其余三家为Figure(Helix模型)、特斯拉(Grok)及英伟达(GR00T)。这意味着,在具身智能的"终极形态"——人形机器人领域,中国团队已跻身全球第一梯队。

Benjie Holson曾言:"我把它设计成当下不可能完成,暴露'视频可用'与'产品可用'的鸿沟。金牌标准就是真正家用机器人必须做到的。"现在,星动纪元用三项全球第一证明,这道鸿沟正在被跨越。

从张雪机车在达喀尔的二度折冠,到星动纪元在Benjie's Olympics的首个登顶,中国高端制造和具身大脑正在全球最严苛的试炼场上,完成从"跟跑"到"领跑"的蜕变。

具身智能的"中国时刻",正在到来。(雷峰网(公众号:雷峰网)


雷峰网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说