> 自媒体 > (AI)人工智能 > 基于 ChatGPT 的输出训练开源 LLM,糟透了!
基于 ChatGPT 的输出训练开源 LLM,糟透了!
来源:CSDN
2023-04-29 17:16:06
286
管理

【CSDN 编者按】曾以为在 ChatGPT 上训练模型是不错的捷径,可如今所有的大模型都

依靠GPT来训练,所有这些内容都来自一个模型,越来越难以区分 LLM 生成的和真正有价值的内容。或许更多基于开源数据集的 LLM 才是我们所需要的。

作者 | Martin Laprise

译者|陈静琳 责编 | 屠敏

出品 | CSDN(ID:CSDNnews)

声明:本文由 CSDN 翻译,未经允许,禁止转载。

随着 ChatGPT 模型的发布和广泛应用,AI 市场中都在竞相创建开源替代方案来与 GPT-3.5/GPT-4 竞争,大多团队的一个常见捷径是在 ChatGPT 上微调他们的模型。我曾认为这样是一个不错的方式,而且完全公平。这样可以借助 OpenAI 有效地将整个网络提炼为他们的模型,包括使用所有公开访问的信息,除了服务条款的细小细节外,表面上看不出有什么重大的道德问题。

不过,直到现在,我意识到,即使忽略掉道德层面的问题,这样的做法本质上来说是错误的。

技术维度看基于 ChatGPT 输出训练开源的 LLM

首先,从纯技术的角度来看,正如 Twitter 网友@yoavgo 近日发布的《Reinforcement Learning for Language Models》文章中解释的那样,没有 RLHF 组件就无法正确对齐 LLM。

监督学习只允许正反馈(我们向模型展示了一系列问题及其正确答案),而 RL 允许负反馈,监督学习模型只允许生成一个答案,所以对于这种类型的交互,我们必须使用 RL 训练。监督训练可能会教模型说谎,最核心的问题是我们希望鼓励模型根据其内部知识进行回答。训练的目标是让模型概括并学习回答任何问题,而不仅仅是指令训练数据中的问题,也希望模型具有普遍性。但是,如果成功地训练模型在这些情况下进行归纳,那么实际上是在教模型编造东西,它积极鼓励模型“说谎”,这是错误的。

语言和思想是紧密相连的,思维过程交给 AI 的结果可能是发展停滞

ChatGPT 是一种商业产品,OpenAI 完全有权随心所欲地调整模型,他们需要确保事情不会失控,但如果它是大模型领域唯一的模型,那会有很大的问题出现

在人类的发展中,语言不是简单的交流方式,主要用于传播我们大脑中建立的思想。语言实际上是思维过程的一部分,语言和思想并不完全相同,但它们紧密地交织在一起。考虑到这一点,人们将一部分思维的过程交给 AI 的长期后果是令人不安的。

进一步说,现在想象一下将这个过程委托给一个由一小群策划人推出高度一致的集中模型,后果是不是更加可怕。希望这不会发生,解决办法就是建立更多的模型,越独立的团队在各种架构、数据集和对齐规则上构建和训练模型,在保持语言和思想多样性方面做得越好。

显然,在 ChatGPT 输出上训练的开源模型无法实现这一目标。

更多基于开源数据集的 LLM 才是我们所需要的

构建那些真正的替代品(如 Open Assistant、StableLM 等)时间是非常紧迫的。OpenAI 模型非常受欢迎,它们输出的内容已经逐渐渗透整个互联网了。很快,像 CommonCrawl 和 Google C4 这样的公共数据集也将包含它生成的内容,并且将越来越难以区分 LLM 生成的和真正有价值的内容。

史蒂夫·乔布斯 (Steve Jobs) 有句名言,计算机就像大脑的自行车。如果执行得好,LLM 完全可以做相同的事情,而我们只需要确保所有自行车都没有被编程将我们所有人带到同一个地方。

在一个完美的世界中,像 OpenAI 和谷歌这样的大公司会给我们提供我们能与之对齐,但可供独立调整的模型,但目前这是难以达到的。因此,最好的选择是让开源模型在开源数据集上进行微调和对齐,可以在必要时重新训练或调整这些数据集。

原文链接:https://gist.github.com/mlaprise/bf4745655194162babfc2d158162e2e0

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
GPT-4.0:人工智能的新篇章
在人工智能的发展历程中,GPT-4.0代表了一个重要的里程碑。作为OpenAI推..
湛江警方成功打掉一个为境外诈骗集团提供服务的特大犯罪团伙..
只需用手机帮忙拨打电话,就有高额的佣金,是不是很有诱惑?近年来,随着..
GPT-4终于可以联网、用插件了,我用完的评价是:拉了..
不过这两个功能都只能单独使用,所以,我们先尝试了一下 ChatGPT 自带的..
泄露用户聊天记录标题,ChatGPT突遭禁用!关闭一天后“残缺版”重新上线..
6个月前,几乎只有科研人员在关注大型语言模型的发展。但去年年底ChatGPT..
广东两名小学校长存不正当关系不雅聊天记录遭公开?教育局:不属实..
9月25日,一段疑似广东潮州市潮安区浮洋镇六联小学校长徐某与潮安区庵埠..
ChatGPT催生敏捷治理,“问数湾区”探讨AI数治创新
ChatGPT等人工智能大模型的“狂飙”,正为全球带来一场翻天覆地的变革。4..
GAITC 2023专题论坛抢鲜看丨ChatGPT点燃科学计算大模型之火..
科学计算作为一项基础学科,是解决科学研究和工程数学问题最优方案,如今..
再反转! 揭开谷歌Gemini复仇GPT-4的底牌
▲谷歌发布了题为《如何制作:通过多模态提示与Gemini互动》的文章今日,..
后续,当事人选择离职了,最精彩的是成都的413人,全部是外包!..
成都CETC事件扩散之后,对中国电科这家这家央企,造成了巨大的影响。很快..
关于作者
御赐铲屎官..(普通会员)
文章
357
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成186645 电子证书795 电子名片49 自媒体20815

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索