> 自媒体 > (AI)人工智能 > ChatGPT突然爆火,内部人也惊呆了
ChatGPT突然爆火,内部人也惊呆了
来源:华尔街见闻
2023-07-11 09:27:47
553
管理

当OpenAI在2022年11月底推出ChatGPT时,几乎没对其抱任何特别的期望,而当ChatGPT开始在网上病毒式传播后,OpenAI争先恐后地追赶,并利用这次机会完善自己的模型。

周五,在接受MIT Technology Review采访时,OpenAI团队对于这次“成功”显得格外谦逊。

OpenAI人工智能政策研究人员Sandhini Agarwal表示,这在内部被视为一次“研究预览”,是一项已有两年历史的技术的更完善版本,也是一次通过收集用户反馈来弥补其缺陷的尝试。另一位研究人员Liam Fedus则指出,OpenAI并不想将其作为一项重大的突破来过度宣传。

自11月以来,OpenAI已经多次更新了ChatGPT,研究人员正在使用一种称为“对抗性训练”的技术来阻止ChatGPT“越狱”(jailbreaking)。这项工作使多个聊天机器人相互对抗:一个聊天机器人扮演对手,通过生成文本来对抗另一个聊天机器,迫使其打破通常的限制。

此外,OpenAI还与微软签署了一项价值数十亿美元的协议,并宣布与全球管理咨询公司贝恩结成联盟,目标是通过突破性的人工智能技术增强客户的业务潜力。在OpenAI之外,围绕ChatGPT掀起了一场“大模型”的淘金热,全球各地公司和投资者都积极参与其中。

以下是采访的具体内容:

火的完全“出乎意料”,会话数据对ChatGPT产生了巨大的积极影响

Jan Leike(负责提高系统安全性团队负责人):老实说,这的确是势不可挡的的。我们很惊讶,也在一直在努力完善。

John Schulman(联合创始人):在发布后的几天里,我经常查看Twitter,在这段疯狂的时间里,充斥着ChatGPT截图。我希望它能获得更多的关注,但我没想到它能火到这种程度。

Sandhini Agarwal(人工智能政策研究员):我认为这对我们所有人来说绝对是一个惊喜,人们开始使用它。我们对这些模型进行了大量研究,以至于我们忘记了它们有时对外界来说是令人惊讶的。

Liam Fedus(人工智能政策研究员):我们很惊讶它的反响,以前有很多人尝试过使用聊天机器人,然而,我们的私人测试版让我们相信,我们拥有了人们可能真正喜欢的东西。

Jan Leike:我想更好地理解是什么推动了这一切,是什么推动着病毒性传播。老实说,我们不知道。

(团队的部分困惑来自于ChatGPT中的大多数技术都不是新的,ChatGPT是GPT-3.5的一个微调版本,GPT-3.5是OpenAI在聊天机器人发布前几个月研究出的大型语言模型。GPT-3.5本身是GPT-3的更新版本,于2020年发布。OpenAI还在2022年1月发布了GPT-3.5的微调版本,名为InstructGPT。但这些早期版本的技术都没有面向公众发布。)

Liam Fedus:ChatGPT模型是从与InstructGPT相同的语言模型中进行微调得出的,我们添加了一些会话数据,并在训练过程进行了一些微调。

我们并不想将其作为一项重大的突破来过度宣传,但事实证明,会话数据对ChatGPT产生了巨大的积极影响。通过标准基准测试评估原始技术能力,模型之间实际上没有实质性差异,但ChatGPT更易于访问和使用。

“不要等到完美的时候再发布它”

Sandhini Agarwal:当我们准备发布时,我们并不认为这个模型存在其他新的风险,GPT-3.5已经发布,我们知道它已经足够安全了。通过ChatGPT对人类偏好的训练,该模型可以自动学习拒绝行为,即拒绝大量请求。

Jan Leike:我们确实为ChatGPT做了一些额外的“红队测试”(red teaming),OpenAI的每个人都试图打破这种模式。我们有外部团体在做同样的事情。我们也有一个早期访问计划,由信任的用户提供反馈。

Sandhini Agarwal:我们确实发现它输出一些不必要的内容,所以作为一个“研究预览”这一意图是好的。

John Schulman:你不能等到你的系统完美后再发布它。我们已经对早期版本进行了几个月的测试,测试人员对产品有较好的印象。我们最担心的是真实性,因为模型喜欢捏造东西。但是InstructGPT和其他大型语言模型已经存在,所以我们认为,只要ChatGPT在真实性和其他安全问题上优于那些模型,应该就是更好的选择。在发布之前,根据我们有限的评估,确认这些模型确实比其他模型更真实和安全,所以我们决定继续发布。

很多问题浮现,“越狱”亟待解决

Sandhini Agarwal:随着ChatGPT的病毒传播,许多问题真正浮出水面,这是我们希望尽快解决的关键问题。比如,ChatGPT非常擅长拒绝不好请求,但它也很容易编写提示,使它不会拒绝我们希望它拒绝的内容。

Liam Fedus:看到用户提供的多样化和创造性的应用程序令人兴奋,但我们始终专注于需要改进的领域。我们认为,通过我们部署、获取反馈和改进的迭代过程,我们可以生产出最强大的技术。而随着技术的发展,新的问题出现不可避免。

Sandhini Agarwal:我们最需要解决问题是“越狱”,当我们发现越狱情况时,我们会将其添加到训练和测试数据中。

Jan Leike:每次有更好的模型时,我们都想将其发布并测试。我们非常乐观地认为,一些有针对性的对抗性训练可以大大改善越狱情况。目前还不清楚这些问题是否会完全消失,但我们认为,这起码可以让很多越狱变得更加困难。

我认为,一旦你部署了这些系统,就很难真正预测它们的真正安全问题。因此,我们非常重视监控人们使用系统的目的,看看发生了什么,然后做出反应。但很难预测当一个系统触及现实世界时会发生的一切。

Sandhini Agarwal:现在的风险肯定比六个月前高得多,但仍低于一年后的水平。显然,这些模型真正重要的一点是它们所使用的环境。与谷歌和微软想法一样,它们注定要成为搜索引擎。像搜索这样的大模型所需要的,与仅仅是一个好玩的聊天机器人的是不同的。

我们需要弄清楚如何在所有这些不同的用途之间保持平衡,创造出在不同环境中对人们有用的东西。在这些环境中,期望的行为可能会发生变化,这增加了更多的压力。我们正在构建这些模型,以便将其转化为产品。ChatGPT是一种产品,现在我们有了API。我们正在构建这种通用技术,并需要确保它在所有方面都能正常工作,这是我们目前面临的关键挑战之一。

本文来自华尔街见闻,欢迎下载APP查看更多

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
微信又上线新功能,聊天突然变了!
近日,微信突然因内测“访客记录”功能,引发全网关注。被内测到的用户,..
元宝可以总结微信聊天记录了
作者 | 黄昱元宝终于拆掉了微信最高的围墙。5月13日,腾讯旗下AI原生应用..
刚刚,微信聊天记录能喂给AI了!我让它爬楼、砍价、整理信息..
智东西作者 | 陈骏达编辑 | 心缘智东西5月13日报道,今天,腾讯宣布,微..
微信聊天出新功能了,快试试!
但要求你的手机安装有元宝App,这时就会跳转到元宝中进行粘贴,你可以发..
不用登你的微信,也能看到你的聊天记录!这几个地方一定赶紧删除..
你知道吗?其实不用登你的微信,也能看到你的聊天记录,是不是太可怕了?..
刚刚,微信聊天记录能喂给AI了,我让它爬楼、砍价、整理信息..
智东西5月13日报道,今天,腾讯宣布,微信已经支持将消息一键转发至元宝..
聊天总把天聊死?这7个雷区,你可能正在踩。如何正确和女生聊天..
明明聊得火热,为什么突然被拉黑?你可能踩中了这七个聊天雷区“在吗?”..
用ChatGPT看病,80%误诊:AI医生的9秒奇迹和80%的残酷真相..
9秒出CT报告,1分钟完成心脏诊断——AI医疗看起来像魔法。但哈佛刚说完:..
突发!OpenAI高层巨震,ChatGPT与CodeX或合并,超级AI来了!..
根据《连线》5 月 15 日的独家报道,在最新一轮组织调整中,OpenAI 总裁 ..
关于作者
搞印刷的黄先..(普通会员)
文章
2075
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110233

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索