来源:市场资讯
(来源:AI信息Gap)
GPT-5.5 Instant,上线了。
替换掉了 GPT-5.3 Instant,成为 ChatGPT 新的默认模型。几亿人打开 ChatGPT 默认用的就是它,包括免费用户。

最大的变化,一个数字。幻觉减少 52.5%。
我们之前聊过 GPT-5.5 的提示词变化,那是 GPT-5.5 Thinking 和满血版 API 的事。今天这个 Instant 是「日常版」,专门给 ChatGPT 用的。
在医学、法律、金融这些高风险领域的测试里,GPT-5.5 Instant 比上一代幻觉(编造事实)少了一半。用户以前标记过的「答错了」对话,拿出来重新测,不准确的回答减少了 37.3%。
OpenAI 官方博客放了一个数学例子,有点意思。
一道带根号的方程问题,用户的解题过程里有一步算错了。GPT-5.3 Instant 一开始说「没问题」,后来把答案代回原方程,发现不对,直接宣布「无解」。
原地放弃。
GPT-5.5 Instant 第一次也没看出来。但它多走了一步,回头检查了代数式展开过程,找到具体哪一步算错了,然后用公式重新解出了正确答案。

一个发现错了会放弃,一个发现错了会往回查。
这就是「幻觉减半」背后的东西。很重要。
来看你们最关心的,「跑分」。
竞赛数学 AIME 2025 从 65.4% 涨到 81.2%,提升最大。博士级科学题 GPQA 从 78.5% 涨到 85.6%,多模态推理 MMMU-Pro 从 69.2% 涨到 76.0%,图表推理 CharXiv 从 75.0% 涨到 81.6%。
文档解析的错误率也从 14.6% 降到了 12.5%。

GPT-5.5 Instant 是 OpenAI 第一个在网络安全和生物领域被列为「高能力」(High Capability)的 Instant 级模型。
以前这个等级是推理模型的专属。现在一个给所有人免费用的日常模型,也到了需要同等安全防护的程度。
系统安全文档是这样描述的。
GPT-5.5 Instant 还没到能独立开发零日漏洞攻击链的水平,那是「关键能力」门槛。但它在网络安全领域的能力已经比 GPT-5.4 强了不少。
GPT-5.5 Instant 已经向所有 ChatGPT 用户推送,还没看到的耐心等待就行。
API 模型 ID gpt-5.5-chat-latest。

来看 ChatGPT 最新额度。
GPT-5.5 Instant,免费用户每 5 小时 10 条,超了自动降级到 mini 模型,上下文窗口 16K。ChatGPT Plus 和 Go 每 3 小时 160 条,上下文窗口 32K。ChatGPT Pro 不限量,上下文窗口 128K。
GPT-5.5 Thinking,付费可选。ChatGPT Plus 和 Business(老 Team 订阅)每周 3000 条爽用,几乎用不完,上下文窗口 256K。ChatGPT Pro 不限量,上下文窗口 400K。
GPT-5.5 Pro 只有 Pro、Business、企业和教育用户能用。
记忆增强和个性化功能目前只对网页版 Plus 和 Pro 用户开放,手机端很快跟进。
GPT-5 系列从发布到现在,被骂了快一年。网上 5000 多人联名要求换回老模型,70% 和信任有关的讨论都是负面的。
骂得最多的就两件事。瞎编乱造、废话太多。
Sam Altman 这次虽然没有「感受到原子弹爆炸」,但看得出来他同样很激动。

5.5 Instant 全改了。已经搬到 Claude 的朋友们,可以考虑回来了。
我是木易,Top2 美国 Top10 CS 硕,现在是 AI 产品经理。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体107754