> 自媒体 > (AI)人工智能 > 轻量版ChatGPT训练方法开源!3天围绕LLaMA打造,号称训练快15倍
轻量版ChatGPT训练方法开源!3天围绕LLaMA打造,号称训练快15倍
来源:量子位
2023-04-28 17:12:45
435
管理

萧箫 发自 凹非寺量子位 | 公众号 QbitAI

基于Meta模型打造的轻量版ChatGPT,这就来啦?

Meta宣布推出LLaMA才三天,业界就出现了把它打造成ChatGPT的开源训练方法,号称比ChatGPT训练速度最高快15倍。

LLaMA是Meta推出的超快超小型GPT-3,参数量只有后者的10%,只需要单张GPU就能运行。

把它变成ChatGPT的方法名叫ChatLLaMA,基于RLHF(基于人类反馈的强化学习)进行训练,在网上很快掀起了一阵热度。

所以,Meta的开源版ChatGPT真的要来了?

先等等,事情倒也没那么简单。

把LLaMA训练成ChatGPT的“开源方法”

点进ChatLLaMA项目主页来看,会发现它实际上集成了四个部分——

DeepSpeed、RLHF方法、LLaMA和基于LangChain agent生成的数据集。

其中,DeepSpeed是一个开源深度学习训练优化库,包含名叫Zero的现存优化技术,用于提升大模型训练能力,具体指帮模型提升训练速度、降低成本、提升模型可用性等。

RLHF则会采用奖励模型来对预训练模型进行微调。奖励模型即先用多个模型生成问题问答,再依靠人工对问答进行排序,让它学会打分;随后,基于奖励学习给模型生成的回答进行打分,通过强化学习的方式增强模型能力。

LangChain是一个大语言模型应用开发库,希望将各种大语言模型整合起来,结合其他知识来源或计算能力创建一个实用的应用程序。LangChAIn agent则会像思维链一样放出GPT-3思考的全过程,将操作记录下来。

这时候你会发现,最关键的依旧是LLaMA的模型权重。它从哪里来?

嘿嘿,自己去找Meta申请吧,ChatLLaMA并不提供。(虽然Meta声称开源LLaMA,但依旧需要申请)

所以本质上来说,ChatLLaMA并不是一个开源ChatGPT项目,而只是一种基于LLaMA的训练方法,其库内集成的几个项目原本也都是开源的。

实际上,ChatLLaMA也并非由Meta打造,而是来自一个叫做Nebuly AI的初创AI企业。

Nebuly AI做了一个叫做Nebullvm的开源库,里面集成了一系列即插即用的优化模块,用于提升AI系统性能。

例如这是Nebullvm目前包含的一些模块,包括基于DeepMind开源的AlphaTensor算法打造的OpenAlphaTensor、自动感知硬件并对其进行加速的优化模块……

这位网友还推荐了一个比库中效果更好的RLHF训练方法,名叫trlx,训练速度要比通常的RLHF方法快上3~4倍:

你拿到LLaMA的代码了吗?觉得这个训练方法如何?

ChatLLaMA地址:https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama

参考链接:https://twitter.com/omarsar0/status/1630211059876339713

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
男子出轨女同事,大尺度暧昧聊天记录被曝出,辣眼睛啊!..
在阅读此文之前,麻烦您点击一下“关注”,既方便您进行讨论和分享,又能..
AI巨头重大宣布:明年上半年对标GPT-4!华为助攻
中国基金报记者 冯尧星火大模型进化至V3.0版、与华为联手推出算力底座平..
华为鸿蒙4.0发布:AI大模型与年轻化UI,小艺智慧堪比ChatGPT?..
在今日的科技变革中,创新成为驱动力,也是塑造未来的关键要素。华为,..
ChatGPT爆火,人工智能到底是怎样“练成”的?
近来,人工智能聊天机器人ChatGPT实火。ChatGPT拥有强大的信息整合能力、..
炒家换大旗?10只新股狂飙,ChatGPT概念大降温,盘后突传利空,盛宴就此结..
投基Z世代,Z哥最实在。今天,首批主板注册制新股集体亮相,受到了市场狂..
每经操盘必知(下午版)丨沪指涨0.4%,AI概念股全线反弹;科技部部长王志刚..
北京时间5月18日15:00,上证指数收盘上涨13.09点,涨幅为0.4%,报收3297...
OpenAI 的嵌入 API太慢了吗?探索其他嵌入模型和服务的优势..
对嵌入模型延迟的半科学调查正如我们上文所讨论的,缓慢的文本生成影响用..
#净网2023#注意!近期爆火的“ChatGPT”,这些法律风险您要当心!(深圳市..
▲在微信上搜索出现的一系列与ChatGPT“沾亲带故”的产品这些产品的服务..
为什么要自己注册个ChatGPT 账号
无论国内还是国外,ChatGPT都是当红辣子鸡,围绕这方面的对标产品在未来..
关于作者
快乐的老范..(普通会员)
文章
404
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40334 企业收录2981 印章生成192878 电子证书830 电子名片52 自媒体25496

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索