π0.7发布，VLA押出了机器人的GPT-3时刻-工信会

> 自媒体 > （AI）人工智能 > π0.7发布，VLA押出了机器人的GPT-3时刻

π0.7发布，VLA押出了机器人的GPT-3时刻

来源：量子位

2026-04-29 12:40:34

140

管理

henry 发自凹非寺

量子位 | 公众号 QbitAI

今天凌晨，Physical Intelligence发布了全新的VLA模型π0.7，狠狠敲了世界模型一记闷棍。

π0.7第一次在机器人领域证明了Compositional Generalization（组合泛化），且VLA。

在遇到新任务时，模型可以组合以前学过的原子技能，自己拼出解法。

就像乔丹会跳投、会后仰，遇到新防守时自己琢磨出后仰跳投。

没人专门教他这一招，他自己组出来了。

Demo里最炸的两个：

任务泛化：机器人没见过空气炸锅，也能根据指令，组合机械臂动作把红薯烤出来。

本体泛化：把从一个机械臂学来的抓取策略，直接部署在另一台机械臂上。

更离谱的是，Physical Intelligence的研究员自己也说不清π0.7到底会什么。

他们还在探索边界，玩起来很有趣，到目前为止效果相当令人惊喜。

切黄瓜、削皮、倒垃圾、烤红薯……都能干

用Physical Intelligence的研究员Ashwin Balakrishna说：

我过去总能根据训练数据猜出模型能做什么。这一次,我猜不到了。

π0.7：具有涌现能力的可控模型

π0.7最核心的洞见只有一句话，多样化的数据需要多样化的prompt。但它带来的结果，远比这句话本身要深远得多。

用多样化的prompt，吃下多样化的数据

过去VLA训练只喂一句清理冰箱，模型得到的信号是单一的。π0.7把prompt展开成四层：

而且π0.7自己琢磨出了和source robot完全不同的抓取策略——

人类操作员在源机器人上用倾斜夹爪贴住桌面抓，π0.7在UR5e上用的是垂直抓取，因为这更适合UR5e更长的手臂运动学。

组合任务泛化：

用空气炸锅做红薯、烤贝果、按下按钮、用抹布擦耳机和尺子、拧旋钮和桌面风扇，训练数据里一条都没有。

第二代是π0开的头，给VLM接一个专门的action expert，用flow matching直接生成连续动作chunk。

中间那些模型——π0.5的open-world generalization、π0.6的RL自我练习、MEM的多尺度记忆——

都没改这个基座。都是在VLM action expert flow matching这个结构上往上加能力。

π0.7也是。架构上它和π*0.6没有本质差别，它加的是prompt的多样性。

这就是为什么论文里说”我们的贡献不是架构”。

但，更有意思的是另一个人。

Lucy Shi，斯坦福博士生在读，师从Chelsea Finn，π0.7的核心作者之一。

她在推特上发了一条thread，讲了一个非常诚实的故事。

之前，她跟着朱玉可、Jim Fan在英伟达做世界模型。

她押的注和Karol他们相反——

世界模型会是关键的钥匙，会在任务泛化上显著超过标准VLA方法。

一开始，结果确实支持这个假设。她拿到了惊艳的组合泛化，机器人能遵循没见过的指令，做训练数据里没有的任务，从其他机器人和人类视频迁移。

但有个奇怪的事情发生了。

他们拿来对比的VLA基线，一直在变强。

随着数据越收越多，VLA越来越强，直到有一天，VLA基线也开始展示出组合泛化的信号。

而且，VLA的方法简单得多。

面对这一问题，Lucy感到无可奈何：

当你的基线吃掉了你的研究假设，你能怎么办？你写一篇论文，去搞清楚基线为什么这么强。

那篇论文，就是π0.7。

参考链接

[1]https://www.pi.website/blog/pi07

[2]https://x.com/physical_int/status/2044841263254638862

[3]https://techcrunch.com/2026/04/16/physical-intelligence-a-hot-robotics-startup-says-its-new-robot-brain-can-figure-out-tasks-it-was-never-taught/

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

π0.7发布，机器人迎来GPT-2时刻

具身泡沫收缩，机器人ChatGPT时刻还没到｜虎嗅CES 2026讨论会

相关文章

2026赛季F1季前测试深度解析：法拉利单圈惊艳，梅赛德斯长跑强势..

第三名之争：迈凯伦 vs 红牛围场共识认为，法拉利和梅赛德斯已在领先集团..

V12引擎加持！改装版Datsun 240Z声浪媲美法拉利

【网通社快报】一辆搭载梅赛德斯-奔驰M120V12引擎的Datsun240Z近日引发关..

法拉利最便宜新敞篷车：Amalfi Spider三月首发

IT之家 2 月 19 日消息，汽车媒体 The Supercar Blog 昨日（2 月 18 日）..

法拉利Ferrari全家福

法拉利是世界顶级超跑代表，源自意大利，以赛道基因和极致性能著称。经典..

6.5 v12炸街，我终于懂了法拉利“纯血”的终极浪漫

法拉利purosangue63° 前门开启79° 后门开启劳斯莱斯式优雅，法拉利式性..

Luce只是其中之一法拉利今年有五款新车型亮相

据海外媒体报道称，法拉利2025年的利润正朝着正确的方向发展，订单已满到..

千匹马力、2.5秒破百！法拉利首款纯电Luce曝光

在内燃机领域拼搏数百年的法拉利正式的拥抱纯电赛道。2026年的2月份，法..

法拉利首款纯电车型Luce正式上市，融合经典设计与电动创新..

【网通社快报】法拉利近日正式推出品牌首款纯电动车Luce，引发行业广泛关..

更硬核的296：法拉利“特别版”新车谍照曝光，马力有望逼近700匹..

IT之家 2 月 16 日消息，博主 Derek Photography 公布了一辆伪装严密、外..

关于作者

横道不笑(普通会员)

文章

2156

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

DeepSeek 究竟是个啥？一文带你看明白

2025/02/08

02

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

03

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

04

这怕是全网最强的 DeepSeek 图片教程吧，赶紧收藏了！

2025/02/09

05

AI 界黑马DeepSeek 超详细介绍

2025/02/09

标签云

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体114249

@2022 All Rights Reserved

浙ICP备19035174号-6 技术支持：千寻网络

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索