> 自媒体 > (AI)人工智能 > 幻觉减半,废话砍三成!被骂一年,OpenAI 终于把 ChatGPT 改对了
幻觉减半,废话砍三成!被骂一年,OpenAI 终于把 ChatGPT 改对了
来源:新浪财经
2026-05-07 17:59:41
97
管理

来源:市场资讯

(来源:AI信息Gap)

GPT-5.5 Instant,上线了。

替换掉了 GPT-5.3 Instant,成为 ChatGPT 新的默认模型。几亿人打开 ChatGPT 默认用的就是它,包括免费用户。

最大的变化,一个数字。幻觉减少 52.5%。

我们之前聊过 GPT-5.5 的提示词变化,那是 GPT-5.5 Thinking 和满血版 API 的事。今天这个 Instant 是「日常版」,专门给 ChatGPT 用的。

在医学、法律、金融这些高风险领域的测试里,GPT-5.5 Instant 比上一代幻觉(编造事实)少了一半。用户以前标记过的「答错了」对话,拿出来重新测,不准确的回答减少了 37.3%。

OpenAI 官方博客放了一个数学例子,有点意思。

一道带根号的方程问题,用户的解题过程里有一步算错了。GPT-5.3 Instant 一开始说「没问题」,后来把答案代回原方程,发现不对,直接宣布「无解」。

原地放弃。

GPT-5.5 Instant 第一次也没看出来。但它多走了一步,回头检查了代数式展开过程,找到具体哪一步算错了,然后用公式重新解出了正确答案。

一个发现错了会放弃,一个发现错了会往回查。

这就是「幻觉减半」背后的东西。很重要。

来看你们最关心的,「跑分」。

竞赛数学 AIME 2025 从 65.4% 涨到 81.2%,提升最大。博士级科学题 GPQA 从 78.5% 涨到 85.6%,多模态推理 MMMU-Pro 从 69.2% 涨到 76.0%,图表推理 CharXiv 从 75.0% 涨到 81.6%。

文档解析的错误率也从 14.6% 降到了 12.5%。

GPT-5.5 Instant 是 OpenAI 第一个在网络安全和生物领域被列为「高能力」(High Capability)的 Instant 级模型。

以前这个等级是推理模型的专属。现在一个给所有人免费用的日常模型,也到了需要同等安全防护的程度。

系统安全文档是这样描述的。

GPT-5.5 Instant 还没到能独立开发零日漏洞攻击链的水平,那是「关键能力」门槛。但它在网络安全领域的能力已经比 GPT-5.4 强了不少。

GPT-5.5 Instant 已经向所有 ChatGPT 用户推送,还没看到的耐心等待就行。

API 模型 ID gpt-5.5-chat-latest。

来看 ChatGPT 最新额度。

GPT-5.5 Instant,免费用户每 5 小时 10 条,超了自动降级到 mini 模型,上下文窗口 16K。ChatGPT Plus 和 Go 每 3 小时 160 条,上下文窗口 32K。ChatGPT Pro 不限量,上下文窗口 128K。

GPT-5.5 Thinking,付费可选。ChatGPT Plus 和 Business(老 Team 订阅)每周 3000 条爽用,几乎用不完,上下文窗口 256K。ChatGPT Pro 不限量,上下文窗口 400K。

GPT-5.5 Pro 只有 Pro、Business、企业和教育用户能用。

记忆增强和个性化功能目前只对网页版 Plus 和 Pro 用户开放,手机端很快跟进。

GPT-5 系列从发布到现在,被骂了快一年。网上 5000 多人联名要求换回老模型,70% 和信任有关的讨论都是负面的。

骂得最多的就两件事。瞎编乱造、废话太多。

Sam Altman 这次虽然没有「感受到原子弹爆炸」,但看得出来他同样很激动。

5.5 Instant 全改了。已经搬到 Claude 的朋友们,可以考虑回来了。

我是木易,Top2 美国 Top10 CS 硕,现在是 AI 产品经理。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
营收三年增16倍,壁仞科技迎来业绩兑现期
3月30日港股盘后,壁仞科技发布上市后的首份财务报告。数据显示,2025年..
对话鹿明机器人创始团队:成立一年多融资数亿,如何靠真机数据促生具身智能..
图片来自视觉中国蓝鲸新闻1月13日讯(记者 武静静)具身智能的热潮仍在持..
美国英伟达推出一系列开源物理人工智能模型及配套硬件,宣称机器人领域已正..
据IT之家1月6日消息,美国英伟达在2026年国际消费电子展上推出一系列开源..
博鳌激辩,人形机器人的“ChatGPT时刻”还有几年?
什么是“ChatGPT时刻”?星动纪元创始人陈建宇向第一财经记者解释,这代..
机器人“GPT时刻”来了?优必选狂卖千台人形机器人
文|财华社当资本市场的目光还紧盯着大模型与算力时,一条来自人形机器人..
大晓机器人王晓刚:人形机器人的“ChatGPT时刻”或在两年后到来..
中国日报3月26日电(记者 马思)在博鳌亚洲论坛2026年年会期间,商汤联合..
刚刚,ChatGPT免费模型升级了:幻觉砍半/记忆更强/回答更简洁..
梦晨 发自 凹非寺量子位 | 公众号 QbitAIChatGPT默认模型,今天大升级。..
启动商业化3个月,ChatGPT广告价格为什么腰斩了?
ChatGPT广告业务启动仅3个月,CPM价格已从60美元腰斩至25-45美元。这背后..
刚刚,GPT-5.5 Instant全员免费!数亿人的ChatGPT变了
编辑:桃子 好困【新智元导读】太突然了!OpenAI深夜甩出GPT-5.5 Instant..
关于作者
婆罗花开(普通会员)
文章
1966
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体107754

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索