谷歌发布最大语言模型：等于9个GPT-3，训练成本却低得多-脚本导航

> 自媒体 > （AI）人工智能 > 谷歌发布最大语言模型：等于9个GPT-3，训练成本却低得多

谷歌发布最大语言模型：等于9个GPT-3，训练成本却低得多

来源：量子位

2023-04-28 17:39:47

592

管理

杨净发自凹非寺量子位报道 | 公众号 QbitAI

今天，谷歌大脑声称，他们新技术能训练万亿级参数的语言模型。

与此同时，此次也首次展现了大型稀疏模型（参数量惊人，但计算成本恒定）也可以用较低精度的格式进行训练。

迄今最大语言模型

Switch Transformer的设计原则是，用一种简单有效的稀疏性扩展Transformer模型的参数量。

它建立在专家混合的基础上，这是90年代初首次提出的人工智能模型范式。

简单来说，就是在一个更大的模型内保留多个专家，或专门从事不同任务的模型，并由一个“门控网络”为任何给定数据选择咨询哪些专家。

接着，研究人员使用了32个TPU内核在一个数据集上预训练了几个不同的Switch Transformer模型。

这一数据集叫做Colossal Clean Crawled Corpus，750GB大小，包含了从Reddit、维基百科和其他网络资源中搜索的文本。

研究人员给这些模型布置了任务，比如，在有15%单词被掩盖的段落中预测出缺失的单词；检索文本来回答问题。

研究人员表示，他们拥有2048个专家系统的1.6万亿参数模型（Switch-C）“完全没有不稳定性”，其速度相比于T5-XXL模型提升了4倍。

此外，研究者还将模型与T5-Base和 T5-Large进行了对比，结果表明，在相同的计算资源下，新模型预训练速度有最高7倍的提升。

研究人员表示，大型稀疏模型可用于创建较小的密集模型，在任务上进行微调，其质量增益为大型模型的30%。

从整体结果上看，Switch Transformer 模型在多项推理和知识任务中带来了显著性能提升。这说明该模型架构不只对预训练有用，还可以通过微调将质量改进迁移至下游任务中。

研究人员表示，

我们无法完全保留模型质量，但通过将我们的稀疏模型提炼成密集模型，可以实现10到100倍的压缩率，同时实现约30%的专家模型的质量增益。

在未来的工作中，研究人员计划将Switch Transformer应用于不同模态或多模态模型，包括图像和文本。

参考链接：论文地址：https://arxiv.org/abs/2101.03961https://venturebeat.com/2021/01/12/google-trained-a-trillion-parameter-ai-language-model/

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

2

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

GPT-3的七夕问候：温哥华小哥的AI哲学家告诉你什么是爱

2023-04-28 17:40

OpenAI的DALL-E 2模型或连接到GPT-3，进一步提升对世界关系的深层理解

2023-04-28 17:38

相关文章

“中国汽车出口猛增，正席卷全球”

【文/观察者网熊超然】当地时间9月6日，《纽约时报》以“中国的汽车正席..

有人年赚百万汽车出海涌现“零公里二手车”

经济观察报记者王帅国在中国汽车出口连年增长的大背景下，二手车出口..

大佬爆赞！余承东邀请周鸿祎体验享界S9 新车豪华美学拉满..

【CNMO科技消息】一年一度的2024粤港澳大湾区车展已经正式揭幕，亮点太多..

深蓝G318解决了方盒子SUV的痛点？看喵哥试驾，你说该卖多少钱..

最近这几年，随着户外露营的兴起，方盒子已经很火了。经常有朋友跟喵哥讲..

多家车企又降价促销了，特斯拉、小鹏等车，最高下调15.1万..

大家都知道，9月份是车市传统销售旺季，消费者购车热情普遍较高，而车企..

丰田汽车全球产销量连续三个月下滑，汽车之王丰田该咋办？..

在世界汽车的江湖之中，丰田汽车可以说是绝对的王者，甚至多年雄踞世界汽..

昔日销冠跌出前十，长城汽车魏建军的焦虑与反思

赵永坡也在社交平台上介绍：“哈弗H6车型是国内最早一批可以实现OTA升级..

汽车资讯∣上汽大众全新途观L PRO上市;丰田新款皇冠陆放上市..

◆ 上汽大众途观L PRO售价23.68万元起5月30日，上汽大众全新途观L PRO正..

汽车电瓶能用几年？瓦尔塔、骆驼、风帆怎么选？一次性给你讲清楚..

咱们汽车上都有一个小电瓶，这个小电瓶的作用就是用来启动发动机的，一旦..

关于作者

有点醉(普通会员)

文章

1107

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

DeepSeek 究竟是个啥？一文带你看明白

2个月前

04

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

05

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

标签云

成员 网址收录40405 企业收录2983 印章生成239816 电子证书1065 电子名片60 自媒体61027

@2022 All Rights Reserved

浙ICP备19035174号-7

2

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索