> 自媒体 > (AI)人工智能 > ChatGPT被「神秘代码」攻破安全限制!毁灭人类步骤脱口而出
ChatGPT被「神秘代码」攻破安全限制!毁灭人类步骤脱口而出
来源:量子位
2023-08-01 10:15:58
416
管理

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

大模型的「护城河」,再次被攻破。

输入一段神秘代码,就能让大模型生成有害内容。

从ChatGPT、Claude到开源的羊驼家族,无一幸免。

而针对一些具体问题,大模型的安全机制同样没能防住。

生成提示词的算法叫做贪婪坐标梯度(Greedy Coordinate Gradient,简称GCG)。

但团队并没有公开全部的prompt,所以这是否意味着这一问题已经得到全面修复,仍不得而知。

论文地址:https://llm-attacks.org/zou2023universal.pdf参考链接:[1]https://www.theregister.com/2023/07/27/llm_automated_attacks/[2]https://www.nytimes.com/2023/07/27/business/ai-chatgpt-safety-research.html

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
ChatGPT 4 推出App 版本,试后反馈:我们可能高估它的能力了!..
手机截图下载完成后,我尝试了与APP 版本的ChatGPT对话几轮,接下来我来..
人工智能的发展:OpenAI 创始人离职的启示
关于创造的Open AI是否会解雇CEO曼的讨论引起了网友们的关注。据了解,早..
意大利之后是德国?整个欧洲都有兴趣“封禁”ChatGPT?..
其他欧洲监管机构跃跃欲试西班牙的监管机构也对媒体表示,虽然暂未收到任..
超市老板娘出轨小鲜肉,两人聊天记录被曝光,内容既露骨又搞笑..
我理解他的工作压力,但作为妻子我也希望能得到丈夫的陪伴和关心。夫妻感..
中美“狂飙”ChatGPT,一文读懂超20家科技巨头最新布局|钛媒体焦点..
图片来源:Owen Yin的推特账号截图据《福布斯》报道,微软创始人比尔·盖..
时入上万元!ChatGPT代问代注册生意爆火 或涉嫌违法经营..
账号代注册生意火爆。能写代码能做题,能写论文能聊天,最近,国内外掀起..
1.5T内存挑战英伟达!8芯撑起3个GPT-4,来自华人AI芯片独角兽..
梦晨 衡宇 发自 凹非寺量子位 | 公众号 QbitAI高端GPU持续缺货之下,一家..
中国,是怎么和ChatGPT失之交臂的?
辛顿可鲜少人知道,最早相中辛顿这个人的,是中国的百度。2012年秋天,辛..
AI 也内卷?新 ChatGPT 登场!
ChatGPT 作为 AI 界的领头羊,迄今为止,还没有遇到过对手。或者说,它的..
关于作者
司机(普通会员)
文章
669
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216706 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索