> 自媒体 > (AI)人工智能 > ChatGPT只是意外全能AI智能体才是真爱!Karpathy:7年前就想到了
ChatGPT只是意外全能AI智能体才是真爱!Karpathy:7年前就想到了
来源:新智元
2026-05-16 13:24:38
76
管理

编辑:定慧 好困

【新智元导读】当全世界为ChatGPT的成功喝彩时,OpenAI一个曾不起眼的小组,却在通过攻克数学难题,秘密锻造其真正的核心武器:「推理」能力,也就是终极目标「AI智能体」的心脏。他们的野望,是打造一个能为你代劳一切事务的全能AI。

历史往往都是由无数「意外和巧合」所塑造的。

2022年,当研究员Hunter Lightman加入OpenAI时,他的同事们正忙于引爆全球的ChatGPT——这无疑是史上用户增长最快的现象级产品。

然而,Lightman却悄悄投身于一个看似不起眼的团队:MathGen。

他们的任务只有一个:训练AI模型去攻克高中级别的数学竞赛难题。

如今,这个曾经默默无闻的MathGen团队,竟被视为OpenAI现在能够问鼎行业的真正原因!

2023年5月31日OpenAI发布研究博客《Improving Mathematical Reasoning with Process Supervision》,正式提出过程监督(process supervision)训练的效果。

从「笨学生」到「奥数金牌」的进化!

平心而论,今天的OpenAI模型远未完美——它们依然会「一本正经地胡说八道」,那些所谓的AI智能体在复杂任务面前也常常束手无策。

但是,一场巨变正在发生!

OpenAI最顶尖的模型,其数学推理能力已实现惊天逆袭!

就在最近,OpenAI的一个模型在全球最顶尖的国际数学奥林匹克(IMO)竞赛中,夺得金牌!

OpenAI坚信,这种强大的推理能力,将可以复制到任何领域!

这正是他们构建通用AI智能体的基石,是他们从创立之初就魂牵梦绕的终极梦想!

如果说,ChatGPT的成功是一场「无心插柳的惊世之作」,一个本想低调测试却意外引爆全球的奇迹。

那么,AI智能体,则是OpenAI精心布局数年、深思熟虑的战略结晶!

扎克伯格不惜血本,开出上亿美元的天价薪酬,从OpenAI挖走了5名o1团队的核心成员,组建Meta的「超级智能」军团。

其中一位,清华校友赵晟佳,更是被直接任命为Meta超级智能实验室的首席科学家!

一场围绕「AI大脑」的人才战争,已然白热化!

强化学习:引爆智能革命的古老技艺

OpenAI这场推理革命的背后,是一种被称为强化学习(RL)的古老技术在焕发新生。

论文地址:https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf

它靠着海量数据和GPU集群,成了文本处理的天才,并最终孕育了ChatGPT。

但它的软肋也同样致命——连基础数学都搞不定。

直到2023年,石破天惊的突破降临!

一个代号「Q*」(后被称为「Strawberry」)的项目,将大语言模型、强化学习(RL)和一种名为「测试时计算」的技术三位一体,融会贯通!

它赋予了模型额外的思考时间,让AI在给出答案前,能反复规划、推演和验证。

「思维链」(CoT)技术由此诞生!AI在处理闻所未闻的数学难题时,表现脱胎换骨!

「我亲眼目睹了模型开始真正地推理,」研究员El Kishky激动地说,「它会发现自己的错误,然后回溯修正,它甚至会表现出沮丧。那感觉,就像在阅读一个人的思想!」

这些技术单拎出来,并非首创。

但OpenAI的鬼斧神工之处,在于将它们以前所未有的方式组合,直接催生了后来的王牌——o1。

那一刻,OpenAI恍然大悟:这种规划与事实核查能力,不正是驱动AI智能体的完美引擎吗?

「我们攻克了一个我苦思冥想数年的难题!」Lightman说,「那是我科研生涯中,最心潮澎湃的瞬间!」

他们的目标只有一个:将这项新能力推向极致!

起初,公司内部甚至没有严格区分「推理模型」和「AI智能体」。

共同的目标只有一个:打造能完成复杂任务的超级AI!

最终,这支特攻队的工作汇入了更宏大的o1模型项目,由联合创始人Ilya Sutskever等一众顶级大佬亲自挂帅。

为了打造o1,OpenAI必须押上最宝贵的资源——顶尖人才和GPU。

在OpenAI,资源从不靠论资排辈,而靠实力说话。

研究员必须用惊人的突破来换取公司的全力支持。

「在OpenAI,所有研究创新都源于一线,是自下而上的。」Lightman解释道。

「当我们把o1的惊人证据摆在桌上时,整个公司立刻达成共识:就是它了,全力冲锋!」

许多前员工认为,正是OpenAI对通用人工智能(AGI)近乎偏执的追求,才催生了这场推理革命。

他们心无旁骛,不为短期产品所动,将所有宝押在了打造最强AI大脑上。这种不计成本的豪赌,在其他AI巨头那里几乎不可能。

这个决策,如今回看,极具远见!

到2024年底,许多AI巨头发现,传统的「堆数据、堆算力」模式,回报越来越低。

而AI领域最激动人心的脉搏,正源自「AI推理」的进步!

当被问及这个问题时,研究员Kishky基巧妙地回答:「我们是在教模型如何最高效地利用算力,去找到答案。如果从这个计算机科学的角度定义,那没错,它就是在推理。」

Lightman的看法则更加务实和「结果导向」:

「别管它内部是怎么运作的!如果一个模型能解决极其困难的问题,那它就已经掌握了达成目标所必需的、近似于推理的能力。」

他总结道,「我们可以称之为推理,因为它看起来就像那么回事。但这都只是手段,我们真正的目的,是为全人类打造强大到不可思议的AI工具!」

OpenAI的科学家们坦言,人们大可不必认同他们对「推理」的定义。

事实上,批评者早已涌现。但他们认为,争论名词远不如模型本身的能力重要。

AI研究员Nathan Lambert打了个绝妙的比方:AI推理就像飞机。

然而,真正的挑战在于主观世界!

当你想让AI帮你网购、或找个长期停车位时,通用的AI智能体(如ChatGPT Agent)往往会让你失望——它们反应迟钝,还尽犯些低级错误。

这正是AI智能体走向普及的最后一道天堑:如何教会AI处理那些没有标准答案、充满主观色彩的任务?

「这本质上是个数据问题,」Lightman一针见血,「我们当前最激动人心的研究,就是如何让模型在不可验证的任务上进行有效训练。我们已经找到了一些线索!」

OpenAI的另一位核心研究员Noam Brown透露,他们已掌握全新的通用强化学习技术,能教会AI那些无法用简单对错来衡量的技能。

那块IMO奥数金牌,正是用这种方法拿下的!

夺金的AI模型,是一种更先进的系统:它能同时派出多个AI智能体,分头探索不同的解题思路,最后优中选优。

如今,谷歌和xAI的最新模型也纷纷采用了这种「群体智能」策略。

「AI的数学能力会越来越强,其他推理领域也一样。」Brown对此信心爆棚,「进步的速度快得令人难以置信,我看不出任何放缓的迹象!」

GPT-5的野望:通往万能AI的终极图景

这些突飞猛进的技术,很可能将在OpenAI即将发布的GPT-5模型中全面展现。

OpenAI的目标只有一个:用GPT-5的绝对优势,捍卫自己在AI智能体领域的王权!

但他们的野心不止于此。

Kishky基描绘了一幅终极图景:未来的AI智能体将能凭直觉理解你的意图,无需你繁琐地设置。

它会自主判断何时调用何种工具、需要投入多少「思考」,就像一个心有灵犀的超级助理。

这,才是ChatGPT的最终形态:一个能为你代劳互联网上一切事务,并且懂你心意的全能AI智能体!

这与今天的ChatGPT相比,已是天壤之别。但毫无疑问,OpenAI的研究正全速驶向这个未来。

然而,赛道已拥挤不堪!

几年前的绝对王者,如今已强敌环伺。DeepSeek、谷歌、Anthropic、xAI、Meta……个个虎视眈眈。

问题不再是OpenAI能否实现其智能体的未来,而是——

它能否在群雄逐鹿的血战中,第一个冲过终点。

参考资料:

https://techcrunch.com/2025/08/03/inside-openais-quest-to-make-ai-do-anything-for-you/

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
最魔幻的一天:黄仁勋北京吃炸酱面,OpenAI 点火英伟达后院..
然而,就在黄仁勋高高兴兴北京逛胡同的时候,太平洋彼岸的纳斯达克,一场..
官司撕开遮羞布,OpenAI 安全管控乱象被全面曝光
来源:环球网 【环球网科技综合报道】5月8日,据外媒TechCrunch报道,特..
Altman 或官宣 OpenAI 硬件;李想谈 L9 4 年才换代:汽车非手机,AI 帮助有..
看似没头没尾,但这几天郭明錤那份"OpenAI 手机加速到 2027 H1"的报告放..
萨姆·阿尔特曼:OpenAI 不想用 AI 把你“换掉”
OpenAI 首席执行官萨姆·阿尔特曼日前在社交平台 X 上公开表示,他的公司..
1340 亿一分不要!马斯克诉 OpenAI 开庭,撕开 8520 亿 AI 帝国的伪装..
2026 年 4 月 28 日,被称为 "AI 世纪诉讼" 的马斯克诉 OpenAI 案在加州..
1万亿美元!Anthropic估值暴涨,反超OpenAI
头图由AI辅助生成智东西编译 | 陈佳编辑 | 程茜智东西4月23日消息,今日..
AI会抢走工作?OpenAI CEO说不会
IT之家 5 月 2 日消息,OpenAI 创始人兼 CEO 萨姆 · 奥尔特曼昨天在 X ..
“开源已死”?怕被 OpenAI 和 Mythos 把代码挖成筛子,4 万 Star 项目突然..
整理|华卫 “开源已死,我们从未想过自己会说出这样的话。”近日,为开..
华尔街惊闻噩耗,Open AI投下深水炸弹,特朗普最担心的事情发生了..
惊雷乍响:OpenAI爆雷,华尔街集体失色据《华尔街日报》最新爆料,AI初创..
关于作者
冷冷的太阳..(普通会员)
文章
2039
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110124

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索