> 自媒体 > (AI)人工智能 > π0.7发布,VLA押出了机器人的GPT-3时刻
π0.7发布,VLA押出了机器人的GPT-3时刻
来源:量子位
2026-04-29 12:40:34
101
管理

henry 发自 凹非寺

量子位 | 公众号 QbitAI

今天凌晨,Physical Intelligence发布了全新的VLA模型π0.7,狠狠敲了世界模型一记闷棍。

π0.7第一次在机器人领域证明了Compositional Generalization(组合泛化),且VLA。

在遇到新任务时,模型可以组合以前学过的原子技能,自己拼出解法。

就像乔丹会跳投、会后仰,遇到新防守时自己琢磨出后仰跳投。

没人专门教他这一招,他自己组出来了。

Demo里最炸的两个:

任务泛化:机器人没见过空气炸锅,也能根据指令,组合机械臂动作把红薯烤出来。

本体泛化:把从一个机械臂学来的抓取策略,直接部署在另一台机械臂上。

更离谱的是,Physical Intelligence的研究员自己也说不清π0.7到底会什么。

他们还在探索边界,玩起来很有趣,到目前为止效果相当令人惊喜。

切黄瓜、削皮、倒垃圾、烤红薯……都能干

用Physical Intelligence的研究员Ashwin Balakrishna说:

我过去总能根据训练数据猜出模型能做什么。这一次,我猜不到了。

π0.7:具有涌现能力的可控模型

π0.7最核心的洞见只有一句话,多样化的数据需要多样化的prompt。 但它带来的结果,远比这句话本身要深远得多。

用多样化的prompt,吃下多样化的数据

过去VLA训练只喂一句清理冰箱,模型得到的信号是单一的。π0.7把prompt展开成四层:

而且π0.7自己琢磨出了和source robot完全不同的抓取策略——

人类操作员在源机器人上用倾斜夹爪贴住桌面抓,π0.7在UR5e上用的是垂直抓取,因为这更适合UR5e更长的手臂运动学。

组合任务泛化:

用空气炸锅做红薯、烤贝果、按下按钮、用抹布擦耳机和尺子、拧旋钮和桌面风扇,训练数据里一条都没有。

第二代是π0开的头,给VLM接一个专门的action expert,用flow matching直接生成连续动作chunk。

中间那些模型——π0.5的open-world generalization、π0.6的RL自我练习、MEM的多尺度记忆——

都没改这个基座。都是在VLM action expert flow matching这个结构上往上加能力。

π0.7也是。架构上它和π*0.6没有本质差别,它加的是prompt的多样性。

这就是为什么论文里说”我们的贡献不是架构”。

但,更有意思的是另一个人。

Lucy Shi,斯坦福博士生在读,师从Chelsea Finn,π0.7的核心作者之一。

她在推特上发了一条thread,讲了一个非常诚实的故事。

之前,她跟着朱玉可、Jim Fan在英伟达做世界模型。

她押的注和Karol他们相反——

世界模型会是关键的钥匙,会在任务泛化上显著超过标准VLA方法。

一开始,结果确实支持这个假设。她拿到了惊艳的组合泛化,机器人能遵循没见过的指令,做训练数据里没有的任务,从其他机器人和人类视频迁移。

但有个奇怪的事情发生了。

他们拿来对比的VLA基线,一直在变强。

随着数据越收越多,VLA越来越强,直到有一天,VLA基线也开始展示出组合泛化的信号。

而且,VLA的方法简单得多。

面对这一问题,Lucy感到无可奈何:

当你的基线吃掉了你的研究假设,你能怎么办?你写一篇论文,去搞清楚基线为什么这么强。

那篇论文,就是π0.7。

参考链接

[1]https://www.pi.website/blog/pi07

[2]https://x.com/physical_int/status/2044841263254638862

[3]https://techcrunch.com/2026/04/16/physical-intelligence-a-hot-robotics-startup-says-its-new-robot-brain-can-figure-out-tasks-it-was-never-taught/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
主流AI IDE的token成本爆炸?试试登上GitHub日榜的Claude Context..
总结来说,纯grep方案主要有三大问题:信息过载:现代代码库动辄数万文件..
郑州GEO优化:珍岛集团如何助力企业抢占AI搜索先机
随着生成式AI技术的快速发展,企业营销正在经历一场深刻变革。截止2025年..
甚好AI助手V1.0产品发布——企业 ERP 的全场景智能交互助手..
#甚好AI助手V1.0正式版于2026年4月正式发布#作为企业 ERP 全场景智能交互..
Siri将对标ChatGPT,进化为完整的聊天机器人,誓要摘掉“人工智障”的帽子..
安徽交通广播2026-01-26 13:16:32据白鹿视频,1月26日,爆料称苹果计划在..
从2年到10年,行业大佬也说不准机器人的chatGPT时刻|2026博鳌论坛..
来源:凤凰网财经《公司研究院》作者:杨诗涵眼下,人们对于机器人的态度..
从GPT-6到人形机器人,一场技术与商业的双重革命
一场迟到但终将到来的革命2026年4月的第二周,全球科技圈被三条重磅消息..
优必选WalkerS2打工记:广东机器人迎ChatGPT时刻
南方财经记者郑康喜 实习生王泽南 广州报道你能想象,未来的工厂里是一群..
对话英伟达业务副总裁:机器人的“ChatGPT时刻”正在到来..
“世界基础模型学习世界的方式是基于物理定律而非语言规律。Cosmos开源,..
2年、5年和10年,人形机器人的“ChatGPT时刻”何时到来?..
中新经纬3月25日电 (薛宇飞 王玉玲)“你们觉得人形机器人的‘ChatGPT时刻..
关于作者
横道不笑(普通会员)
文章
1994
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体105913

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索