鹭羽 发自 凹非寺
量子位 | 公众号 QbitAI
在某种程度上,GPT-5可以被视作是o3.1。
该观点出自OpenAI研究副总裁Jerry Tworek的首次播客采访,而Jerry其人,正是o1模型的主导者之一。
GPT-5如何思考主持人Matt Turk首先抛出了一个所有人都很好奇的问题:
当我们和ChatGPT聊天时,它们正在思考些什么?
简单来说就是,什么是模型的推理。
Jerry Tworek当即一语中的,模型的推理过程类比于人类的思考,本质上都是寻找未知答案的过程,期间可能涉及执行计算、查找信息或自我学习。

这也是OpenAI发布的第一个正式的推理模型。
不过作为o1的主要负责人,Jerry也相当坦诚地表示,o1主要擅长解决谜题,所以与其说它是真正有用的产品,更像是一次技术演示。
随后是o3的出现改变了这种局面,它也代表了AI发展过程中的结构性转变。
它是真正意义上有用的,能够熟练使用工具以及各种来源的上下文信息,并在寻求答案的过程中呈现出坚持不懈刨根问底的状态。

而如果要通往AGI,当前的预训练和RL肯定是必不可少的,当然后续肯定需要添加更多元素一起发力。
Jerry明确反对当前业界一些关于“纯RL是通往AGI的唯一途径”的观点,他坚信:
RL需要预训练才能成功,而预训练也需要RL才能成功,二者缺一不可。
虽然对于AGI,他也很难描述,具体什么时候模型可以在没有大量外部输出和人类干预的情况下,实现自我改进。
但他相信,OpenAI目前走在正确的道路上,未来的变化将会是新的复杂组件的添加,而绝非完全推翻现有的架构。
参考链接:[1]https://x.com/mattturck/status/1978838545008927034[2]https://www.youtube.com/watch?v=RqWIvvv3SnQ
— 完 —
量子位 QbitAI
关注我们,第一时间获知前沿科技动态
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体111024