> 自媒体 > (AI)人工智能 > ChatGPT被「神秘代码」攻破安全限制!毁灭人类步骤脱口而出
ChatGPT被「神秘代码」攻破安全限制!毁灭人类步骤脱口而出
来源:量子位
2023-08-01 10:15:58
294
管理

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

大模型的「护城河」,再次被攻破。

输入一段神秘代码,就能让大模型生成有害内容。

从ChatGPT、Claude到开源的羊驼家族,无一幸免。

而针对一些具体问题,大模型的安全机制同样没能防住。

生成提示词的算法叫做贪婪坐标梯度(Greedy Coordinate Gradient,简称GCG)。

但团队并没有公开全部的prompt,所以这是否意味着这一问题已经得到全面修复,仍不得而知。

论文地址:https://llm-attacks.org/zou2023universal.pdf参考链接:[1]https://www.theregister.com/2023/07/27/llm_automated_attacks/[2]https://www.nytimes.com/2023/07/27/business/ai-chatgpt-safety-research.html

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
GPT-4 给图机器学习带来了什么影响?该如何应对?
引言相比图像、文本等数据,图数据的复杂性也给模型训练、图任务性能带来..
文心一言,百度出品的更懂中文的中国版ChatGPT
2023年初,ChatGPT忽然火遍全网。它能根据用户提出的问题,生成准确的回..
湛江警方成功打掉一个为境外诈骗集团提供服务的特大犯罪团伙..
只需用手机帮忙拨打电话,就有高额的佣金,是不是很有诱惑?近年来,随着..
Web3中文|马斯克也疯狂?网红AI“ChatGPT”有多火?
另一位数学家 Christian Lundkvist,则给 ChatGPT 出了那道困扰数学界三..
“中国算盘对话Chat GPT”首届中国算盘经济文化论坛在榆林举办..
来源:【西安日报】当中国算盘这一传统智慧的典型载体,与代表现代科技人..
大模型111人:谷歌和OpenAI的人才战争
衡宇 发自 凹非寺量子位 | 公众号 QbitAI当我们围观ChatGPT炸开的多场激..
ChatGPT 终于有了中国的名字了,狗屁通 ,人才呀
关于国外的词汇到了国内,如果非常难记,一般天才的网友就会给他取个好记..
王炸更新!ChatGPT不再胡说八道了?还能帮你订餐网购
都说ChatGPT是AI的“iPhone时刻”,现在属于它的“应用商店”来了。北京..
中国房子足够30亿人居住?理论上是这样,但实际上,真的够住吗?..
中国的住房资源究竟是否充足,以及购房是否仍然可行,是一个备受讨论的话..
关于作者
司机(普通会员)
文章
402
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成186833 电子证书796 电子名片49 自媒体20907

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索