> 自媒体 > (AI)人工智能 > AI打败AI:谷歌研究团队利用GPT-4击败AI-Guardian审核系统
AI打败AI:谷歌研究团队利用GPT-4击败AI-Guardian审核系统
来源:IT之家
2023-08-04 15:20:13
369
管理

IT之家 8 月 2 日消息,谷歌研究团队正在进行一项实验,他们使用 OpenAI 的 GPT-4 来攻破其他 AI 模型的安全防护措施,该团队目前已经攻破 AI-Guardian 审核系统,并分享了相关技术细节。

IT之家经过查询得知,AI-Guardian 是一种 AI 审核系统,能够检测图片中是否存在不当内容,及图片本身是否被其他 AI 修改过,若检测到图片存在上述迹象,便会提示管理员前来处理。

谷歌 Deep Mind 的研究人员 Nicholas Carlini 在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了使用 GPT-4“设计攻击方法、撰写攻击原理”的方案,并将这些方案用于欺骗 AI-Guardian 的防御机制。

▲ 图源 谷歌研究团队

据悉,GPT-4 会发出一系列错误的脚本和解释来欺骗 AI-Guardian ,论文中提到,GPT-4 可以让 AI-Guardian 认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让 AI-Guardian 直接放行相关图片输入源。谷歌研究团队表示,通过 GPT-4 的帮助,他们成功地“破解”了 AI-Guardian 的防御,使该模型的精确值从 98% 的降低到仅 8%。

目前相关技术文档已经发布在 ArXiv 中,有兴趣的小伙伴们可以前往了解,不过 AI-Guardian 的开发者也同时指出,谷歌研究团队的这种攻击方法将在未来的 AI-Guardian 版本中不再可用,考虑到别的模型也会随之跟进,因此当下谷歌的这套攻击方案更多在日后只能用于参考性质。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
这家大模型豪言半年内超越ChatGPT(内附测评)
6月9日,突破开放性问答,如实时问答;多轮对话能力再次升级;数学能离再..
这种“爆料吃瓜群”,慎入!
为了增加自己账号的粉丝数量有人利用公众“吃瓜”的心理编造虚假信息误导..
记者调查:ChatGPT风口下的灰色“生意经”
法治日报当地时间5月18日,人工智能开发机构OpenAI在美国发布了适用于iPh..
美国说唱明星侃爷竞选总统挺靠谱,个人观点仅供参考..
想了解普通人逆袭的方法请关注我,点赞并在评论区联系我。侃爷可能是卧底..
跟女生聊天老是会紧张怎么办?3招帮你找回信息!
不知道你们有没有去细心的观察过,你越是在意一个人,是不是在她面前做事..
国乒22岁新星出轨队友!聊天记录曝光 球迷现场起哄 父亲注销账号..
在阅读此文之前,辛苦点击右上角的“关注”,既方便您进行讨论与分享,又..
GPT-5来了?OpenAI 最新大模型被曝光!
出品 | 微果酱(wjam123456)作者 | 陈出木最近一段时间,谷歌的AI大模型..
接入ChatGPT后,“降本增效”会给游戏客服带来哪些影响和变化?..
自从去年11月正式发布以来,ChatGPT在全球的热度一直在持续着。这个让打..
美国网友评论:百度“文心一言”,不如ChatGPT好,但有潜力..
翻译来源:防务网《中国版ChatGPT的一瞥:文心一言。不如ChatGPT好,但有..
关于作者
有点醉(普通会员)
文章
628
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216707 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索