> 自媒体 > (AI)人工智能 > 0门槛克隆ChatGPT!30分钟训完,60亿参数性能堪比GPT-3.5
0门槛克隆ChatGPT!30分钟训完,60亿参数性能堪比GPT-3.5
来源:新智元
2023-06-22 23:03:04
581
管理

编辑:编辑部

【新智元导读】破解「CloseAI」,ChatGPT克隆羊问世!0门槛实现「自研」,从此大语言模型不再只是少数大公司的「金手指」。

此前,OpenAI不Open的事件,已经引发了坊间的诸多争议。

光放出基准和测试结果,不提供训练数据、成本、方法,是真的要「赢家通吃」了。

60亿参数堪比ChatGPT,30分钟就训好

由于ChatGPT需要消耗大量的数据和算力资源(利用数万个单词训练,消耗大量GPU),所以这类大语言模型注定只能被少量巨头所掌握。

和「CloseAI」相反,Meta在今年3月向学术界发布了一组高质量(但不是指令跟随的)语言模型LLaMA,每个模型的训练时间超过了80,000个GPU小时。

随后,斯坦福大学基于LLaMA构建了Alpaca,但不同之处在于,它利用一个包含50,000个问题和答案的小数据集进行了微调。令人惊讶的是,这使得Alpaca具有了类似于ChatGPT的交互性。

而Dolly正是受到了Alpaca的启发。

更有趣的是,拥有60亿参数的Dolly并没有利用现在最新的模型,而是选择了一个2021年发布的开源模型——GPT-J。

由于Dolly本身是一个模型的「克隆」,所以团队最终决定将其命名为「多利」——有史以来第一个被克隆的动物。

而这种「创造性」问题,显然是ChatGPT的强项,洋洋洒洒地写了300多个字。

开放问答

在事实性问题的问答测试上,团队选择了下面这个:「向我解释一下核裂变和核聚变之间的区别。」

先不管对错,GPT-J全篇都是在讲太阳如何如何,虽然提到了「聚变」这个词,但完全无视了「裂变」。

而Dolly第一句就直接点题——核裂变和核聚变的区别在于释放能量的方式,随后简单解释了他们的不同。

相比之下,ChatGPT给出的回答明显要更加翔实。

头脑风暴

当让它们头脑风暴,给出应该阅读的五本科幻小说的名单,GPT-J则只是在喃喃自语,像是沉浸在了拖延阅读而产生的愧疚情绪中,完全回避了这个提问。

Dolly则一如既往的表现稳定,按照指令给出了5本科幻小说的书名及其作者。

ChatGPT对于该问题给出了更加丰富的回答,不仅包括书名和作者,还对每一本书的内容、类型作了简要评述和介绍。

你要Close,我就Open

对于很多公司而言,宁愿自己建立一个不那么强的模型,也不愿将数据发送给那些只提供API的大语言模型供应商。

其中一个重要原因便是,这些问题和数据集是公司最敏感和专有的知识产权,直接将其交给第三方显然是不靠谱的。

此外,公司自身可能在模型质量、成本和期望行为方面有不同的权衡,一种可定制化的语言模型更加符合需求。

现在,Dolly的发布给了他们希望——即便是一个「过时」的开源大型语言模型 (LLM),也能通过30分的训练,赋予它神奇的类似ChatGPT的指令跟随能力。

不难想象,大语言模型或许很快就不是AI巨头公司独占的玩法了!

正如公司CEO Ali Ghodsi所说,「我们的信念是,让全世界的每个组织都能利用这些技术。」

参考资料:

https://www.databricks.com/blog/2023/03/24/hello-dolly-democratizing-magic-chatgpt-open-models.html

https://venturebeat.com/ai/databricks-debuts-chatgpt-like-dolly-a-clone-any-enterprise-can-own/

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
新车 | 505两驱海浪Plus版更划算?比亚迪海豹06GT该怎么选?..
文:懂车帝原创 曹浩[懂车帝原创 产品] 日前,比亚迪海洋网旗下海豹06GT..
深扒比亚迪财报:数据打架!谁在曲解?谁在隐瞒?
哈喽大家好!比亚迪2024上半年的财报出来了,但是对这同一份财报,却出现..
月销 50 万辆,比亚迪杀疯了!
“金九银十”这个传统旺季的杀伤力,果然名不虚传,10 月刚过,几乎所有..
比亚迪前三季营收5023亿:净利252亿 计入政府补助23亿
比亚迪2024年第三季营收为2011.25亿元,同比增长24%;净利为116.07亿元,..
新车|售23.98万元,2024款创维HT-i创业版上市,比亚迪唐DM同级..
文:懂车帝原创 张凯[懂车帝原创 产品] 日前,我们从创维汽车官方获悉,2..
吉利的“DM-i”,从鄙视到成为比亚迪,新能源车市充斥着“真香”..
10月30日,吉利正式发布全球新一代超级电混——雷神EM-i超级电混,其实从..
比亚迪营收首超特斯拉 ,市值却只有后者 1/6
比亚迪又达成了一个「里程碑」。10 月 30 日晚,比亚迪发布了 2024 年三..
一家抵五家总和!前三季度比亚迪净利252亿遥遥领先,新能源车成盈利风向标..
主要上市乘用车企业业绩加速分化。日前,A股主要上市乘用车企业悉数发布..
比亚迪暂缓加拿大上市进程,美国电动新势力股价暴跌|海外日报..
「 Top 3 News 」比亚迪暂时搁置其在加拿大的上市计划要点:比亚迪,近日..
关于作者
我是歌王(普通会员)
文章
1126
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40404 企业收录2983 印章生成239232 电子证书1064 电子名片60 自媒体59741

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索