幻觉减半，废话砍三成！被骂一年，OpenAI 终于把 ChatGPT 改对了-工信会

> 自媒体 > （AI）人工智能 > 幻觉减半，废话砍三成！被骂一年，OpenAI 终于把 ChatGPT 改对了

幻觉减半，废话砍三成！被骂一年，OpenAI 终于把 ChatGPT 改对了

来源：新浪财经

2026-05-07 17:59:41

137

管理

来源：市场资讯

（来源：AI信息Gap）

GPT-5.5 Instant，上线了。

替换掉了 GPT-5.3 Instant，成为 ChatGPT 新的默认模型。几亿人打开 ChatGPT 默认用的就是它，包括免费用户。

最大的变化，一个数字。幻觉减少 52.5%。

我们之前聊过 GPT-5.5 的提示词变化，那是 GPT-5.5 Thinking 和满血版 API 的事。今天这个 Instant 是「日常版」，专门给 ChatGPT 用的。

在医学、法律、金融这些高风险领域的测试里，GPT-5.5 Instant 比上一代幻觉（编造事实）少了一半。用户以前标记过的「答错了」对话，拿出来重新测，不准确的回答减少了 37.3%。

OpenAI 官方博客放了一个数学例子，有点意思。

一道带根号的方程问题，用户的解题过程里有一步算错了。GPT-5.3 Instant 一开始说「没问题」，后来把答案代回原方程，发现不对，直接宣布「无解」。

原地放弃。

GPT-5.5 Instant 第一次也没看出来。但它多走了一步，回头检查了代数式展开过程，找到具体哪一步算错了，然后用公式重新解出了正确答案。

一个发现错了会放弃，一个发现错了会往回查。

这就是「幻觉减半」背后的东西。很重要。

来看你们最关心的，「跑分」。

竞赛数学 AIME 2025 从 65.4% 涨到 81.2%，提升最大。博士级科学题 GPQA 从 78.5% 涨到 85.6%，多模态推理 MMMU-Pro 从 69.2% 涨到 76.0%，图表推理 CharXiv 从 75.0% 涨到 81.6%。

文档解析的错误率也从 14.6% 降到了 12.5%。

GPT-5.5 Instant 是 OpenAI 第一个在网络安全和生物领域被列为「高能力」（High Capability）的 Instant 级模型。

以前这个等级是推理模型的专属。现在一个给所有人免费用的日常模型，也到了需要同等安全防护的程度。

系统安全文档是这样描述的。

GPT-5.5 Instant 还没到能独立开发零日漏洞攻击链的水平，那是「关键能力」门槛。但它在网络安全领域的能力已经比 GPT-5.4 强了不少。

GPT-5.5 Instant 已经向所有 ChatGPT 用户推送，还没看到的耐心等待就行。

API 模型 ID gpt-5.5-chat-latest。

来看 ChatGPT 最新额度。

GPT-5.5 Instant，免费用户每 5 小时 10 条，超了自动降级到 mini 模型，上下文窗口 16K。ChatGPT Plus 和 Go 每 3 小时 160 条，上下文窗口 32K。ChatGPT Pro 不限量，上下文窗口 128K。

GPT-5.5 Thinking，付费可选。ChatGPT Plus 和 Business（老 Team 订阅）每周 3000 条爽用，几乎用不完，上下文窗口 256K。ChatGPT Pro 不限量，上下文窗口 400K。

GPT-5.5 Pro 只有 Pro、Business、企业和教育用户能用。

记忆增强和个性化功能目前只对网页版 Plus 和 Pro 用户开放，手机端很快跟进。

GPT-5 系列从发布到现在，被骂了快一年。网上 5000 多人联名要求换回老模型，70% 和信任有关的讨论都是负面的。

骂得最多的就两件事。瞎编乱造、废话太多。

Sam Altman 这次虽然没有「感受到原子弹爆炸」，但看得出来他同样很激动。

5.5 Instant 全改了。已经搬到 Claude 的朋友们，可以考虑回来了。

我是木易，Top2 美国 Top10 CS 硕，现在是 AI 产品经理。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

AI for Science 会有 “ChatGPT 时刻” 吗？年轻人该如何下注？

1个月前

DeepSeek 又改了”常识”：这次他们教 AI 像人一样”看书”

1个月前