GPT“高仿”系列开源了！最大可达GPT-3大小，能自主训练-脚本导航

> 自媒体 > （AI）人工智能 > GPT“高仿”系列开源了！最大可达GPT-3大小，能自主训练

GPT“高仿”系列开源了！最大可达GPT-3大小，能自主训练

来源：量子位

2023-07-21 11:28:47

694

管理

萧箫发自凹非寺量子位报道 | 公众号 QbitAI

虽然GPT-3没有开源，却已经有人在复刻GPT系列的模型了。

例如，慕尼黑工业大学的Connor Leahy，此前用200个小时、6000RMB，复现了GPT-2。

作者表示，目前他们已经成功制造出GPT-2大小的模型。

从项目代码的可扩展性来看，他们预计可以复刻出GPT-3大小的语言模型，甚至比GPT-3更大。

不仅如此，由于这是个开源的项目，大家还可以自主训练这些模型（将来也会包括GPT-3）。

目前，作者已经给出了详细的训练步骤。

消息一出，网友沸腾了：

要是真能复现，说不定会比现在的GPT-3还要更好用！

……

这个项目还在施工中，不过，连模型的训练方式都准备好了。

项目计划通过TPU或GPU，对大语言模型进行训练。

为此，作者们已经基于Tensorflow-mesh（用于在GPU上训练模型）、Deepspeed（用于在TPU上训练模型）两个项目，编写了GPT-Neo的训练代码。

这两个项目都可以扩展到大于GPT-3的大小，甚至还能更大。

因此，训练GPT-3大小的模型，软件理论上是可行的。

但硬件上的问题，目前作者们还在思考明确的解决方案。如果将来真的做出了GPT-3大小的模型，他们打算先从谷歌那多要点免费资源，如果不行的话，就再说……

不过，如果你的GPU硬件足够OK，也可以选择直接训练GPT-Neo，就不用设置一系列谷歌云了。

此外，也可以用谷歌Colab来训练项目，它免费提供TPU-V8S处理器，训练GPT的3XL（1.5B参数）版本绰绰有余。

训练过程也不复杂，主要包括创建分词器、数据集预处理、指定训练数据集、选择训练配置、训练模型几个步骤。

在创建分词器上，GPT-Neo目前提供一个Huggingface的预训练GPT-2分词器。不过，也可以训练自己专属的分词器。

然后，对数据进行预处理，可以直接下载项目提供的数据，也可以使用自己的数据集。

在那之后，指定模型训练所用的数据集，然后对训练方式进行设置，例如优化算法、训练步数等。

然后，指定硬件名称、数量，就可以开始训练模型了。

“只会用谷歌搜索的自动化团队”

不过，对于GPT系列的项目复现，有网友并不看好。

网友认为，GPT-X系列项目，就像是一个由几百人组成的自动化团队，这几百人只会用谷歌搜索来干活，而且还没办法写出最新的新闻事件报道。（因为训练数据无法一直更新）

它虽然是个非常有趣的研究，但目前却还没有一个“杀手级”应用，来让GPT-3项目的存在变得更有意义。

当然，也有人认为，复现这一项目还是有意义的。

即使只是“几百个只会用搜索引擎干活的团队”，他们也需要快速给出某个问题的答案。

如何在大量零碎信息中，高效地选出最优解，本身就是GPT-X项目的价值之一。毕竟如果只是几百个“会用谷歌搜索”的人组成的团队，是无法像GPT-3一样，快速得出最佳答案的。

当然，也有一些程序员调侃，要是这个GPT-3项目真的被复现了，岂不是他们马上就要失业了。

“我们总是在用谷歌搜索、和stackoverflow来解决问题。这不就是像GPT-3一样，只会整合搜索引擎上的信息，来解决问题吗？”

“该死，原来GPT-3竟然可以取代这么多程序员。”

目前，GPT-Neo的所有项目和代码已开源。

想要上手一试、或是对项目感兴趣的小伙伴，可以行动起来了~

项目地址：https://github.com/EleutherAI/gpt-neo

参考链接：https://www.eleuther.ai/gpt-neohttps://news.ycombinator.com/item?id=25819803

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

英伟达H100用11分钟训完GPT-3，PyTorch创始人：不要只看时间

2023-07-21 11:30

陶哲轩甩出调教GPT-4聊天记录，点击领取大佬的研究助理

2023-07-21 11:23

相关文章

蓝皮书：为何中国汽车要走全球化之路

中新网四川新闻9月1日电 (单鹏)第二十七届成都国际汽车展览会(下称成都国..

试驾现代Ioniq 5N——电动汽车时代第一款热门掀背车

现代 Ioniq 5 N 评测为了获得完整的体验，请切换到运动模式，激活 N e-Sh..

覆盖比亚迪、吉利等20多款新能源车，这份官方新名单出炉！买车又要便宜了....

从具体车型来看，吉利银河星舰（询底价|查参配）7定位于一款中型SUV，搭..

大众汽车将与德国工会谈判！裁员和工厂关闭成焦点！或面临罢工风险..

每经记者：董天意每经编辑：孙磊随着德国大众汽车集团（以下简称大众汽..

岚图知音：2米9轴距！续航900公里！副驾带桌板！中国生产卖全球..

岚图是东风汽车旗下定位高端的新能源品牌，旗下已有岚图FREE、岚图梦想家..

宝骏云海：续航1100km！10.98万带高速领航！有它你还看啥宋Pro？..

近日，宝骏旗下全新紧凑型SUV宝骏云海上市。作为天舆架构下的首款宝骏车..

东风本田灵悉L汽车上市：续航520km、电子外后视镜，12.98万元..

IT之家 9 月 26 日消息，东风本田旗下电动子品牌灵悉的首款量产车型 ——..

如何为家庭出行选择SUV? 零跑C16和奕派008深入解读

如果手头上有20万左右的购车预算，你会考虑哪款车型？随着“大家庭”的比..

名爵MG5：6.59万起！名爵MG5、帝豪、轩逸你怎么选？

9月13日，新款名爵MG5正式上市。新车共推出3款车型，官方指导售价区间8.1..

关于作者

雷振杍(普通会员)

文章

1065

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

DeepSeek 究竟是个啥？一文带你看明白

2个月前

04

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

05

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

标签云

成员 网址收录40402 企业收录2983 印章生成238687 电子证书1060 电子名片60 自媒体58194

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索