> 自媒体 > (AI)人工智能 > GPT-5.3上线Codex,OpenAI回应Claude新模型只用了15分钟
GPT-5.3上线Codex,OpenAI回应Claude新模型只用了15分钟
来源:36氪
2026-05-28 18:17:39
46
管理

火星撞地球,新模型大战!

Claude Opus 4.6发布仅仅15分钟,OpenAI也甩出了自己最新最强编程模型——

GPT-5.3-Codex。

硬实力方面,官方给出的亮点如下:

更聪明:SWE-Bench Pro 57%,TerminalBench 2.0 76%,OSWorld 64%。

更可控:支持任务进行中的实时引导,可随时调整方向并获取更新。

更快速:完成相同任务时,所需token不到5.2-Codex的一半,单token速度提升超过25%。

更Agent:不只是更会写代码,计算机操作同样很强。

直接看这张对比表会更直观,几乎每一个维度,都比上一代有明显提升。

网友直呼过于刺激,昨天OpenAI刚被Anthropic拿广告狙了一枪,今天就对轰了回来。

一天之内,两个重量级编程模型。

更关键的是效率。在拿下这些成绩的同时,GPT-5.3-Codex使用的token数量少于任何以往模型。

除了编程能力,新一代Codex的另一个重点是Computer use。

OSWorld是一项面向智能体的计算机使用基准测试,要求模型在可视化的桌面计算机环境中完成各类生产力任务。

结果显示,GPT-5.3-Codex在计算机使用能力上,明显强于此前的GPT模型。

综上,GPT-5.3-Codex不是一次单点模型能力突破,更像是基于智能体的全方位发展,编码、前端开发、计算机操作全都有提升。

更有意思的是,这次GPT-5.3-Codex直接参与了自己的训练过程。

OpenAI表示,这是他们首个参与「自我加速」的模型。Codex团队在研发过程中使用其早期版本,来调试自身训练流程、管理部署,并评估测试结果。

官方也给出了一些具体例子。

在训练阶段,研究团队使用Codex监控和调试训练任务,帮助在整个训练过程中追踪模型行为变化,对交互进行深入分析,并提出改进方案。

在数据分析方面,一位数据科学家与GPT-5.3-Codex协作,构建了新的数据管道,并以远超传统仪表盘工具的方式对结果进行了可视化。

随后,研究人员与Codex一起分析这些结果,模型在不到三分钟内,就从数千个数据点中提炼出了关键洞见。

工程团队则借助Codex优化和适配GPT-5.3-Codex的测试与运行框架。

当开始出现影响用户体验的异常边缘案例时,团队成员通过Codex定位到了上下文渲染相关的缺陷,并进一步追溯到了缓存命中率偏低的原因。

Two More Things

与Anthropic的巅峰对决的确相当精彩,但OpenAI其实还有两个值得关注的大动作。

1、Frontier:一个帮助企业打造「AI同事」的平台

这是OpenAI一项相当重磅的ToB业务,目标很明确:让Agent真正进入公司工作流。

具体实现方式,包括共享上下文、上手式的入职引导、带反馈的实践学习,以及清晰的权限与边界。

据悉,HP、Intuit、Oracle、State Farm、Thermo Fisher和Uber等知名企业,已经早早采用了Frontier。

2、AI4S:OpenAI和Ginkgo联手,用GPT-5把蛋白质合成成本打下来了40%

这是一家做合成生物学的实验室型公司,他们将GPT-5接入一座自主实验室,让模型可以提出实验方案、规模化执行实验、从结果中学习,并决定下一步该尝试什么,完整跑通了一个闭环。

2026年,或许是AI4S加速演进的一年。

不过,在OpenAI忙着和Anthropic对狙,网友们被一系列新动态弄的眼花缭乱的同时,评论区也有另一种声音。

把4o还给我!!

直到现在,奥特曼依然没有回应4o被彻底下架这件事。

或许,真的是和Anthropic打得太忙了。

参考链接:

[1]https://openai.com/index/introducing-gpt-5-3-codex/

[2]https://openai.com/index/introducing-openai-frontier/

[3] https://x.com/i/trending/2019496485793198148

本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
ChatGPT智能体上线,奥特曼:感受到AGI的瞬间,但风险不容忽视..
当地时间7月17日,OpenAI推出ChatGPT智能体(ChatGPT agent),整合早期..
OpenAI发布AI浏览器ChatGPT Atlas,谷歌股价应声下跌
当地时间10月21日,OpenAI正式推出首款人工智能驱动的网页浏览器ChatGPT ..
从ELIZA到ChatGPT:AI聊天机器人四代迭代如何骗过人类
1966年,一位用户在麻省理工学院的计算机终端上与一个名为“ELIZA”的程..
OpenAI发布浏览器ChatGPT Atlas,挑战谷歌
10月21日,OpenAI推出人工智能浏览器ChatGPT Atlas,这是一款基于ChatGPT..
AI 到底是什么?从二战密码机到 ChatGPT,70 年史诗级进化全揭秘..
前言2022 年底,ChatGPT 横空出世,一夜之间让「人工智能」从科技圈的小..
每个人都能定制GPT,OpenAI会是下一个苹果吗
(图片来源:视觉中国)经济观察网 记者 任晓宁 北京时间11月7日深夜2点,A..
GPT-5.2被曝作弊!偷袭谷歌竟靠拉爆token刷高分,不如Gemini 3..
编辑:Aeneas 好困【新智元导读】GPT-5.2打赢Gemini 3.0 Pro,竟是靠高推..
GPT-5被吐槽没进步?Epoch年终报告打脸:AI在飞速狂飙,ASI更近了..
【导读】Epoch AI年终大盘点来了!出乎意料的是,AI没有停滞,反而变快了..
GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道..
鹭羽 发自 凹非寺量子位 | 公众号 QbitAI在某种程度上,GPT-5可以被视作..
关于作者
烽火(普通会员)
文章
1993
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体111002

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索