ChatGPT只是意外全能AI智能体才是真爱！Karpathy：7年前就想到了-工信会

> 自媒体 > （AI）人工智能 > ChatGPT只是意外全能AI智能体才是真爱！Karpathy：7年前就想到了

ChatGPT只是意外全能AI智能体才是真爱！Karpathy：7年前就想到了

来源：新智元

2026-05-16 13:24:38

94

管理

编辑：定慧好困

【新智元导读】当全世界为ChatGPT的成功喝彩时，OpenAI一个曾不起眼的小组，却在通过攻克数学难题，秘密锻造其真正的核心武器：「推理」能力，也就是终极目标「AI智能体」的心脏。他们的野望，是打造一个能为你代劳一切事务的全能AI。

历史往往都是由无数「意外和巧合」所塑造的。

2022年，当研究员Hunter Lightman加入OpenAI时，他的同事们正忙于引爆全球的ChatGPT——这无疑是史上用户增长最快的现象级产品。

然而，Lightman却悄悄投身于一个看似不起眼的团队：MathGen。

他们的任务只有一个：训练AI模型去攻克高中级别的数学竞赛难题。

如今，这个曾经默默无闻的MathGen团队，竟被视为OpenAI现在能够问鼎行业的真正原因！

2023年5月31日OpenAI发布研究博客《Improving Mathematical Reasoning with Process Supervision》，正式提出过程监督（process supervision）训练的效果。

从「笨学生」到「奥数金牌」的进化！

平心而论，今天的OpenAI模型远未完美——它们依然会「一本正经地胡说八道」，那些所谓的AI智能体在复杂任务面前也常常束手无策。

但是，一场巨变正在发生！

OpenAI最顶尖的模型，其数学推理能力已实现惊天逆袭！

就在最近，OpenAI的一个模型在全球最顶尖的国际数学奥林匹克（IMO）竞赛中，夺得金牌！

OpenAI坚信，这种强大的推理能力，将可以复制到任何领域！

这正是他们构建通用AI智能体的基石，是他们从创立之初就魂牵梦绕的终极梦想！

如果说，ChatGPT的成功是一场「无心插柳的惊世之作」，一个本想低调测试却意外引爆全球的奇迹。

那么，AI智能体，则是OpenAI精心布局数年、深思熟虑的战略结晶！

扎克伯格不惜血本，开出上亿美元的天价薪酬，从OpenAI挖走了5名o1团队的核心成员，组建Meta的「超级智能」军团。

其中一位，清华校友赵晟佳，更是被直接任命为Meta超级智能实验室的首席科学家！

一场围绕「AI大脑」的人才战争，已然白热化！

强化学习：引爆智能革命的古老技艺

OpenAI这场推理革命的背后，是一种被称为强化学习（RL）的古老技术在焕发新生。

论文地址：https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf

它靠着海量数据和GPU集群，成了文本处理的天才，并最终孕育了ChatGPT。

但它的软肋也同样致命——连基础数学都搞不定。

直到2023年，石破天惊的突破降临！

一个代号「Q*」（后被称为「Strawberry」）的项目，将大语言模型、强化学习（RL）和一种名为「测试时计算」的技术三位一体，融会贯通！

它赋予了模型额外的思考时间，让AI在给出答案前，能反复规划、推演和验证。

「思维链」（CoT）技术由此诞生！AI在处理闻所未闻的数学难题时，表现脱胎换骨！

「我亲眼目睹了模型开始真正地推理，」研究员El Kishky激动地说，「它会发现自己的错误，然后回溯修正，它甚至会表现出沮丧。那感觉，就像在阅读一个人的思想！」

这些技术单拎出来，并非首创。

但OpenAI的鬼斧神工之处，在于将它们以前所未有的方式组合，直接催生了后来的王牌——o1。

那一刻，OpenAI恍然大悟：这种规划与事实核查能力，不正是驱动AI智能体的完美引擎吗？

「我们攻克了一个我苦思冥想数年的难题！」Lightman说，「那是我科研生涯中，最心潮澎湃的瞬间！」

他们的目标只有一个：将这项新能力推向极致！

起初，公司内部甚至没有严格区分「推理模型」和「AI智能体」。

共同的目标只有一个：打造能完成复杂任务的超级AI！

最终，这支特攻队的工作汇入了更宏大的o1模型项目，由联合创始人Ilya Sutskever等一众顶级大佬亲自挂帅。

为了打造o1，OpenAI必须押上最宝贵的资源——顶尖人才和GPU。

在OpenAI，资源从不靠论资排辈，而靠实力说话。

研究员必须用惊人的突破来换取公司的全力支持。

「在OpenAI，所有研究创新都源于一线，是自下而上的。」Lightman解释道。

「当我们把o1的惊人证据摆在桌上时，整个公司立刻达成共识：就是它了，全力冲锋！」

许多前员工认为，正是OpenAI对通用人工智能（AGI）近乎偏执的追求，才催生了这场推理革命。

他们心无旁骛，不为短期产品所动，将所有宝押在了打造最强AI大脑上。这种不计成本的豪赌，在其他AI巨头那里几乎不可能。

这个决策，如今回看，极具远见！

到2024年底，许多AI巨头发现，传统的「堆数据、堆算力」模式，回报越来越低。

而AI领域最激动人心的脉搏，正源自「AI推理」的进步！

当被问及这个问题时，研究员Kishky基巧妙地回答：「我们是在教模型如何最高效地利用算力，去找到答案。如果从这个计算机科学的角度定义，那没错，它就是在推理。」

Lightman的看法则更加务实和「结果导向」：

「别管它内部是怎么运作的！如果一个模型能解决极其困难的问题，那它就已经掌握了达成目标所必需的、近似于推理的能力。」

他总结道，「我们可以称之为推理，因为它看起来就像那么回事。但这都只是手段，我们真正的目的，是为全人类打造强大到不可思议的AI工具！」

OpenAI的科学家们坦言，人们大可不必认同他们对「推理」的定义。

事实上，批评者早已涌现。但他们认为，争论名词远不如模型本身的能力重要。

AI研究员Nathan Lambert打了个绝妙的比方：AI推理就像飞机。

然而，真正的挑战在于主观世界！

当你想让AI帮你网购、或找个长期停车位时，通用的AI智能体（如ChatGPT Agent）往往会让你失望——它们反应迟钝，还尽犯些低级错误。

这正是AI智能体走向普及的最后一道天堑：如何教会AI处理那些没有标准答案、充满主观色彩的任务？

「这本质上是个数据问题，」Lightman一针见血，「我们当前最激动人心的研究，就是如何让模型在不可验证的任务上进行有效训练。我们已经找到了一些线索！」

OpenAI的另一位核心研究员Noam Brown透露，他们已掌握全新的通用强化学习技术，能教会AI那些无法用简单对错来衡量的技能。

那块IMO奥数金牌，正是用这种方法拿下的！

夺金的AI模型，是一种更先进的系统：它能同时派出多个AI智能体，分头探索不同的解题思路，最后优中选优。

如今，谷歌和xAI的最新模型也纷纷采用了这种「群体智能」策略。

「AI的数学能力会越来越强，其他推理领域也一样。」Brown对此信心爆棚，「进步的速度快得令人难以置信，我看不出任何放缓的迹象！」

GPT-5的野望：通往万能AI的终极图景

这些突飞猛进的技术，很可能将在OpenAI即将发布的GPT-5模型中全面展现。

OpenAI的目标只有一个：用GPT-5的绝对优势，捍卫自己在AI智能体领域的王权！

但他们的野心不止于此。

Kishky基描绘了一幅终极图景：未来的AI智能体将能凭直觉理解你的意图，无需你繁琐地设置。

它会自主判断何时调用何种工具、需要投入多少「思考」，就像一个心有灵犀的超级助理。

这，才是ChatGPT的最终形态：一个能为你代劳互联网上一切事务，并且懂你心意的全能AI智能体！

这与今天的ChatGPT相比，已是天壤之别。但毫无疑问，OpenAI的研究正全速驶向这个未来。

然而，赛道已拥挤不堪！

几年前的绝对王者，如今已强敌环伺。DeepSeek、谷歌、Anthropic、xAI、Meta……个个虎视眈眈。

问题不再是OpenAI能否实现其智能体的未来，而是——

它能否在群雄逐鹿的血战中，第一个冲过终点。

参考资料：

https://techcrunch.com/2025/08/03/inside-openais-quest-to-make-ai-do-anything-for-you/

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

同样是AI助手，ChatGPT为何没陷入豆包般的非议？

三足鼎立：Gemini、ChatGPT、Claude Code 对比，谁是最佳 AI 助手？

相关文章

2026赛季F1季前测试深度解析：法拉利单圈惊艳，梅赛德斯长跑强势..

第三名之争：迈凯伦 vs 红牛围场共识认为，法拉利和梅赛德斯已在领先集团..

V12引擎加持！改装版Datsun 240Z声浪媲美法拉利

【网通社快报】一辆搭载梅赛德斯-奔驰M120V12引擎的Datsun240Z近日引发关..

法拉利最便宜新敞篷车：Amalfi Spider三月首发

IT之家 2 月 19 日消息，汽车媒体 The Supercar Blog 昨日（2 月 18 日）..

法拉利Ferrari全家福

法拉利是世界顶级超跑代表，源自意大利，以赛道基因和极致性能著称。经典..

6.5 v12炸街，我终于懂了法拉利“纯血”的终极浪漫

法拉利purosangue63° 前门开启79° 后门开启劳斯莱斯式优雅，法拉利式性..

Luce只是其中之一法拉利今年有五款新车型亮相

据海外媒体报道称，法拉利2025年的利润正朝着正确的方向发展，订单已满到..

千匹马力、2.5秒破百！法拉利首款纯电Luce曝光

在内燃机领域拼搏数百年的法拉利正式的拥抱纯电赛道。2026年的2月份，法..

法拉利首款纯电车型Luce正式上市，融合经典设计与电动创新..

【网通社快报】法拉利近日正式推出品牌首款纯电动车Luce，引发行业广泛关..

更硬核的296：法拉利“特别版”新车谍照曝光，马力有望逼近700匹..

IT之家 2 月 16 日消息，博主 Derek Photography 公布了一辆伪装严密、外..

关于作者

冷冷的太阳..(普通会员)

文章

2112

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

DeepSeek 究竟是个啥？一文带你看明白

2025/02/08

02

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

03

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

04

这怕是全网最强的 DeepSeek 图片教程吧，赶紧收藏了！

2025/02/09

05

AI 界黑马DeepSeek 超详细介绍

2025/02/09

标签云

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体114249

@2022 All Rights Reserved

浙ICP备19035174号-6 技术支持：千寻网络

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索