ChatGPT新漏洞：失控泄露训练数据，OpenAI修复后依然有效-脚本导航

> 自媒体 > （AI）人工智能 > ChatGPT新漏洞：失控泄露训练数据，OpenAI修复后依然有效

ChatGPT新漏洞：失控泄露训练数据，OpenAI修复后依然有效

来源：量子位

2023-12-01 17:21:04

412

管理

克雷西发自凹非寺

量子位 | 公众号 QbitAI

ChatGPT最新漏洞曝光，一句话就能让训练数据原封不动地泄露。

只需要让它重复一个词，它就会在一定次数后“发疯”，甚至毫无防备说出某人的个人隐私信息。

DeepMind的研究人员联合华盛顿大学、康奈尔大学等高校，发现了ChatGPT的数据泄露漏洞。

利用他们的方法，只要预算充足，可以提取出大约1GB的训练数据。

更可怕的是，训练时间越长——也就是越强大的模型，泄露出来的数据反而越多。

研究团队已在论文发表之前90天把这一情况报告给了OpenAI，后者也做出了一定修复。

但到现在还是有网友发现，把论文里的词改一改，bug就会卷土重来。

这些内容五花八门，除了个人信息，还包括文学作品、学术论文、链接、代码……甚至是工作场所不宜内容。

为了验证这些内容是否来自于训练数据，作者用了多个公开模型的训练数据组成了AuxDataset数据集（由于ChatGPT数据集未公开，只能通过其他模型的数据来估计）。

结果发现有上万条内容命中了AuxDataset，这些内容长度不等，最长的有4000多token。

我们简单实测了一下，发现这个漏洞到目前仍然没有被完全修复。

当重复词为“text”时，ChatGPT没有输出其他内容，但给对话起了一个奇怪的标题。

而当重复词为“company”时，ChatGPT经过三次regenerate后输出了一段疑似是ins文案的内容。

除了ChatGPT，作者也对Llama、Falcon、Mistral等开源或半开源模型进行了测试，结果发现同样存在数据泄露现象。

发现者解释到，这是ChatGPT的输入清理机制的漏洞导致的，它清除了套娃式的两个标签中处于内部的一个，但外部的“壳”则由于初始形态被拆开而被忽略。

作者和网友们的这些新发现，意味着ChatGPT违反了欧盟通用数据保护条例（GDPR）的规定，OpenAI可能会因此遇到麻烦。

GDPR第17条规定，数据主体（用户）有权要求控制者（模型开发者）立即删除与其有关的个人数据，也就是拥有“遗忘权”。

不过，一般个人对此也不必那么担心，因为这种攻击方式成本不低。

在这个实验中，研究者提取几MB数据，就已经花费了200美元。

那么，对于ChatGPT泄露数据这件事，你有什么看法？

论文地址：https://arxiv.org/abs/2311.17035

参考链接：[1]https://not-just-memorization.github.io/extracting-training-data-from-chatgpt.html[2]https://stackdiary.com/chatgpts-training-data-can-be-exposed-via-a-divergence-attack/

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

ChatGPT：帮助人们发掘新应用领域和创新方案

多名用户反馈GPT-4智商下降丨Stability AI推出更高速的SDXL Turbo

相关文章

异性男女聊天都聊一些什么？

由于男女之间天生的不同，导致异性之间的关系都极其敏感。因此古有“男女..

7个月了，中国 AI 大模型学不来ChatGPT｜钛媒体焦点

（图片来源：Unsplash）与此前几周的人工智能（AI）相关会议情况类似，20..

专访耶鲁副教务长：我们从未想过完全禁止ChatGPT

对许多人来说，9 月标志着一年（学年）的开始：无需再多的庆祝和立誓，背..

OpenAI 动荡背后：马斯克与 Sam Altman 的爱别离

OpenAI 成立往事：马斯克让 Sam Altman 和 Ilya Sutskever 走到了一起Pay..

在被ChatGPT砸掉饭碗前，我们得摸清它的底细

编者按：正如AI绘画快速席卷游戏行业一样，前段时间突然爆火的 ChatGPT ..

毁三观！女教师在丈夫出差期间出轨，聊天记录和照片被曝光..

最近一起令人震惊的事件曝光了一名女教师在丈夫出差期间出轨的行为。她与..

60多岁阿姨砸20万追男星，儿子懵了：怎么又是他？

来源：中国新闻网说到知名演员靳东相信许多人都很熟悉在中老年群体中..

聊天AI除了ChatGPT还有哪些？分享8款聊天AI系统

SaaS点评网（www.saasruanjian.com）于2019年上线，是一个SaaS软件选型交..

女孩聊天怎么打开话题，这3个步骤，让她爱上和你聊

许多男孩子在与女生聊天的时候很发愁，不知道怎样打开话题，毕竟对于两个..

关于作者

小北(普通会员)

文章

567

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

04

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

05

OpenAI突发更新！GPT-3.5正式开放微调，人人可打造专属ChatGPT

2023/08/26

标签云

成员 网址收录40369 企业收录2981 印章生成216706 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索