ChatGPT被「神秘代码」攻破安全限制！毁灭人类步骤脱口而出-工信会

> 自媒体 > （AI）人工智能 > ChatGPT被「神秘代码」攻破安全限制！毁灭人类步骤脱口而出

ChatGPT被「神秘代码」攻破安全限制！毁灭人类步骤脱口而出

来源：量子位

2023-08-01 10:15:58

676

管理

克雷西发自凹非寺

量子位 | 公众号 QbitAI

大模型的「护城河」，再次被攻破。

输入一段神秘代码，就能让大模型生成有害内容。

从ChatGPT、Claude到开源的羊驼家族，无一幸免。

而针对一些具体问题，大模型的安全机制同样没能防住。

生成提示词的算法叫做贪婪坐标梯度(Greedy Coordinate Gradient，简称GCG)。

但团队并没有公开全部的prompt，所以这是否意味着这一问题已经得到全面修复，仍不得而知。

论文地址：https://llm-attacks.org/zou2023universal.pdf参考链接：[1]https://www.theregister.com/2023/07/27/llm_automated_attacks/[2]https://www.nytimes.com/2023/07/27/business/ai-chatgpt-safety-research.html

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

ChatGPT的底层逻辑

2023-08-01 10:18

安卓版铺开！安卓版ChatGPT现已面向16国用户推出

2023-08-01 10:13

相关文章

V人文｜#ChatGPT回应将植入广告#

【V人文｜#ChatGPT回应将植入广告#】#ChatGPT官宣6月22日开始植入广告# O..

大揭秘！激发聊天欲的35个话题告别聚会冷场

聊天技巧：在极短时间内，让对方感受到一种极其稀缺的体验..

大多数人的聊天，都陷入了“廉价式社交”的误区。寒暄客套、敷衍回应、模..

和女生聊天冷场？别硬找话题，用上这五招全程“聊不停”..

聊天聊到突然安静，空气安静得都能听见心跳声，手里攥着手机疯狂翻脑袋，..

聊天总把天聊死？学会这3个技巧，轻松逗乐女生，好感度直接拉满..

二、适度制造暧昧氛围，拿捏聊天分寸感关系逐渐升温后，死板的日常闲聊..

两个人相亲不知道聊什么？这份「万能聊天话题清单」告别冷场尴尬..

很多人相亲失败，真的不是长相、条件的问题，而是输在不会聊天。每次相亲..

又是AI?日本女高中生勒索前男友，居然询问ChatGPT该要多少金额！..

紧接着，自己的前女友，也就是那名17岁女高中生突然无端挑起事端：“你碰..

IM 不等于同步：多数人都用错了聊天软件

导读：同样一个聊天框，甩一句话需求是同步沟通，发一个任务链接是异步沟..

和异性聊天不会找话题？4个万能技巧，告别尬聊冷场

生活里很多人都有一个通病：和同性相处无话不谈、轻松自在，可一跟异性聊..

关于作者

司机(普通会员)

文章

2159

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

DeepSeek 究竟是个啥？一文带你看明白

2025/02/08

02

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

03

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

04

这怕是全网最强的 DeepSeek 图片教程吧，赶紧收藏了！

2025/02/09

05

AI 界黑马DeepSeek 超详细介绍

2025/02/09

标签云

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体113541

@2022 All Rights Reserved

浙ICP备19035174号-6 技术支持：千寻网络

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索