> 自媒体 > (AI)人工智能 > ChatGPT变笨新解释:世界被AI改变,与训练时不同了
ChatGPT变笨新解释:世界被AI改变,与训练时不同了
来源:报人刘亚东
2024-01-03 17:15:15
245
管理

提取任务示例:通过调整提示词,让模型自己把训练数据中的任务示例背出来

从GPT-3 davinci-001版本到GPT-3.5-Turbo,这个问题越来越严重了。

图中X代表模型复述出了训练数据数据中的原始任务示例,绿色代表经过指令微调的模型没有复述训练数据。

灰色代表未经过指令微调的模型无法根据提示词指示复述训练数据,但不代表问题不存在。

成员推断(只适用于生成任务):检查模型生成的答案是否与原始数据完全相同

最后团队的结论为:

由于任务污染,闭源模型可能会在零样本或少样本评估中表现的比实际好,特别是经过RLHF微调的模型。污染的程度仍不清楚,因此我们建议谨慎行事。

在实验中,对于没有任务污染可能性的分类任务,大模型很少在零样本和少样本设置中表现出相对于大多数基线具有统计学意义的显著改进。

随着时间推移,观察到GPT-3系列模型在许多下游任务的的零样本或少样本性能有所增加,这可能是由于任务污染造成的。

即使对于开源模型,检查训练数据的任务污染也很困难。

鼓励公开发布训练数据,以便检查任务污染问题。

有人总结到:

用现有数据训练AI

人们过多使用AI,以至于改变了现实世界

AI无法适应改变后的世界,变得低效

这是一个循环。

论文:

https://arxiv.org/abs/2312.16337

参考链接:

[1]https://twitter.com/ChombaBupe/status/1741531065032798360

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
ChatGPT目前还没有开放国内版。#干货
ChatGPT来了,你以为它是来卖课的,实际上它是卖软件的,你以为它是来卖..
ChatGPT 有了自己的“电脑”,是机会还是风险?
人工智能即将到来,我们根本不知道结果会是什么,所以我们的责任是推动人..
53岁女子出轨27岁男子聊天记录不堪入目,网友辣评:真是丢死人..
在阅读此文之前,麻烦您点击一下“关注”,既方便您进行讨论和分享,还可..
两个在游戏里对飚中文的老外,怎么就在中国火了?
UP主@信徒Shinja未曾想到,自己在游戏中录下的一场「不期而遇」,竟能演..
定位ChatGPT中文版的元语智能,宣战不久已“翻车”
伴随ChatGPT在国内外的火热,站队者与挑战者相继现身。近日,号称国内首..
掌握这四个技巧,与领导私聊提升情商,事业更上一层楼!..
#挑战30天在头条写日记#在职场中,与领导保持良好的沟通关系对于个人的职..
GPT-4要来了!一文看尽大型语言模型的过去、现在、未来..
预训练阶段是从2018年到2022年,相比之前的最大变化是加入自监督学习,张..
卖账号、赚打赏 他们用 ChatGPT 搞钱
文章内容不构成买卖依据,投资有风险,入市需谨慎!网友罗浩(化名)用Cha..
AIROOM新版ChatGPT入门手册即将开放发布,免费免费!
在我们的AIROOM里面写了一版ChatGpt入门操作手册,内容还在更新中,目前..
关于作者
素素鴉(普通会员)
文章
478
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40335 企业收录2981 印章生成194962 电子证书832 电子名片53 自媒体26195

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索