> 自媒体 > (AI)人工智能 > 永别了,GPT-4
永别了,GPT-4
来源:36氪
2026-05-07 20:00:11
131
管理
GPT-4,已成历史尘埃

Perplexity CEO Aravind Srinivas最近表示,AI的进步已经跨越了临界点——三个月的时间,仿佛就已经跳过了一章历史。

2023年5月4日,GPT-4正式联网,微软开放搭载GPT-4的全新Bing聊天机器人,全面开放插件系统,无需排队人人可用。

2023年7月7日,Code Interpreter官宣向Plus用户全面开放,实测案例惊人。

因此大家确认,这名网友并没有撒谎,或伪造截图,因为顺着这个对话链接检查,会发现model-slug确实是GPT-4.1。

很快,有越来越多的人发现自己也能用GPT-4.1了。

此外,也有网友推测,奥特曼口中的「Quasars Alpha」,就是GPT-4.1。

为保o3发布,测试时间大幅缩短

而FT的报道也再次证实,满血版o3下周很可能再次上线。

知情人士透露,由于Meta、谷歌、xAI这些对手逼得实在太紧,OpenAI为了保持自己的技术优势并从中获利,不得不加快模型的发布速度。

为此,曾经需要数月时间进行的模型「评估」——测试模型的风险和性能,如今已被压缩到了只有短短的几天。

比如即将退役的GPT-4,就有着长达6个月的评估期。其中一些危险能力,正是在测试进行了两个月后才被发现的。

但现在给到的时间和资源,已经不足以进行全面的测试来识别和规避风险了。

此前,OpenAI曾承诺构建定制版的模型来评估潜在的滥用风险,例如是否可能助长生物病毒提高传播能力。

但这种方法成本很高,不仅要聘请外部专家,还要创建诸如病毒学这类的专业信息数据集,并将其「喂」给模型来进行微调,消耗大量的工程师和计算资源。

很明显,OpenAI不想在这件事上花太多精力——他们只对能力较弱的旧模型做了微调,没有用到更强、更先进的模型上。

比如,在1月份发布的o3-mini安全与性能报告中,仅仅提到了GPT-4o只会在微调后才能执行某项生物学任务。至于o1和o3-mini如何,OpenAI却只字未提。

另外,还有一个令人担忧的问题是,安全测试针对的并不是最终向公众发布的模型,而是更为早期的「检查点」(checkpoints)。在这之后,模型还会继续更新来提升性能和能力。

面对这些质疑,OpenAI回应称,其评估流程已通过引入自动化测试等方式提高了效率,从而缩短了所需时间。

「虽然目前还没有一套公认的方案,但OpenAI采用的方法肯定是最优的,并且已在报告中公开透明地进行了说明。」

此外,OpenAI还表示,测试所用的检查点与最终发布的版本「基本一致」。

参考资料:

https://x.com/whylifeis4/status/1910719046665884006

https://www.ft.com/content/8253b66e-ade7-4d1f-993b-2d0779c7e7d8

https://techcrunch.com/2025/04/11/openai-is-winding-down-its-gpt-4-ai-model-in-chatgpt/

编辑:Aeneas 好困

本文来自微信公众号“新智元”,作者:新智元,36氪经授权发布。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
ChatGPT vs DeepSeek:AI时代两款产品的用户体验深度对比
ChatGPT和DeepSeek作为当前AI领域的两大热门产品,凭借其强大的语言处理..
OpenAI发布ChatGPT团队工作流AI智能体,自动化处理复杂任务..
来源:市场资讯(来源:IT之家)IT之家 4 月 23 日消息,OpenAI 今天(4 ..
苹果新成立“Answers”团队 计划推出精简版的ChatGPT竞品..
来源:环球网 【环球网科技综合报道】8月4日消息,据外媒报道,苹果成立..
顶级恐怖,MIT数学实锤证明:ChatGPT正诱发「AI精神病」,全球14人已死亡..
【导读】就在刚刚,MIT伯克利斯坦福的研究者给出数学铁证:ChatGPT正诱发..
GPT-6药研效率提升3-5倍 vs Grok 3设计提速40%,如何选择AI模型?..
GPT-6和Grok 3,如今在AI领域是两座风格迥异的高峰。一个被OpenAI视为通..
周调用量占61.2%,国产大模型成本为何仅为GPT-4的约1/70?..
2026年2月,全球最大AI模型API平台OpenRouter的数据显示,中国大模型的周..
营收三年增16倍,壁仞科技迎来业绩兑现期
3月30日港股盘后,壁仞科技发布上市后的首份财务报告。数据显示,2025年..
对话鹿明机器人创始团队:成立一年多融资数亿,如何靠真机数据促生具身智能..
图片来自视觉中国蓝鲸新闻1月13日讯(记者 武静静)具身智能的热潮仍在持..
美国英伟达推出一系列开源物理人工智能模型及配套硬件,宣称机器人领域已正..
据IT之家1月6日消息,美国英伟达在2026年国际消费电子展上推出一系列开源..
关于作者
司机(普通会员)
文章
2053
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体107764

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索