单张GPU搞定GPT-3超参数！先训练小模型，再“一键迁移”| 已开源-脚本导航

> 自媒体 > （AI）人工智能 > 单张GPU搞定GPT-3超参数！先训练小模型，再“一键迁移”| 已开源

单张GPU搞定GPT-3超参数！先训练小模型，再“一键迁移”| 已开源

来源：量子位

2023-05-04 21:54:05

463

管理

丰色发自凹非寺

量子位 | 公众号 QbitAI

“一个GPU没法训练GPT-3，更别提在上面调整超参数了。”

不不不，现在情况有变——

在单个GPU上完全可以调整大规模模型的超参数。

怎么说？

原来有人发现了一种新的调参方法，无论模型规模怎么变化，所得的最优超参数都能保持性能稳定。

由此一来，我们可以先训练一个小版本的模型，在上面间接调整好超参，然后以零样本的方式直接将它们复制到全尺寸模型上，就能获得相当不错的性能。

这对手里GPU资源不够的人来说简直不要太好了吧。

目前，相关帖子也在Reddit上引起热议，得到了300 的点赞支持。

好了，这时你可能会问：能不能只缩小模型的宽度呢？

作者表示，对于“non-width stuff”，没有理论保证。

不过好消息是，他们在preLN Transformer的合理范围内对depth、batch size、sequence length和timestep的迁移效果进行了测试。

关于作者

一作名叫Greg Yang，微软高级研究员。

通讯作者为微软研究院深度学习技术中心合伙人研究经理、IEEE Fellow高剑峰。

还有两位华人作者分别为来自微软的Liu Xiaodong（北京邮电大学校友）和Chen Weizhu （已在微软工作16年）。

他们的这篇成果已被NeurIPS 2021接收。

GitHub链接：https://github.com/microsoft/mup

论文地址：https://arxiv.org/abs/2203.03466

官方博客链接：https://www.microsoft.com/en-us/research/blog/µtransfer-a-technique-for-hyperparameter-tuning-of-enormous-neural-networks/

Reddit讨论：https://www.reddit.com/r/MachineLearning/comments/tb0jm6/r_you_cant_train_gpt3_on_a_single_gpu_but_you_can/

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

GPT-3：一个有望通过图灵测试的人工智能模型

2023-05-04 21:57

对话出门问问李志飞：GPT-3 是「暴力美学」的一次胜利

2023-05-04 21:52

相关文章

4S店关了，消费者权益不能随意“关”|荔枝时评

文/熊志（作者熊志，荔枝新闻特约评论员，资深评论人；本文系荔枝新闻客..

4S店现关停潮，消费者权益谁来保障？

“品牌授权已取消”“公司当前暂停营业”“已提出退网申请”……近期，部..

多地4s店迎来倒闭潮，他们可以一跑了之但消费者怎么办呢？..

最近，多地4S店倒闭潮的消息如惊雷般炸响，让汽车行业的从业者和广大消费..

二手车｜别克GL8：空间超大还保值！奶爸首选

随着二胎、三胎政策的放开，再加上生活水平的提升，越来越多的消费者在购..

二手车｜天籁：十一、二万，日系+中型+大沙发都有？..

十一、二万，你是选择一台紧凑型还是一台二手日系中型轿车？入门级车型更..

买新车贬值快\u0026#34;不划算\u0026#34;？这几款二手车开上几年不会亏，还..

既然买新车"吃亏"，那么二手车怎样呢？今天漫哥就跟大家推荐几款在一直保..

不敢买二手车？看完这些买前功课放心去买吧

[爱卡汽车淘二手车原创]随着近几年国内二手车行业的发展，相信大家也感..

选购二手车，先看这几点，新手避坑指南

哈喽，兄弟们！熟悉南哥的都知道，南哥自己买的车大多是都二手，比如天籁..

新能源二手车能不能买？三吱跑了1300公里告诉你答案

不知道大家有没有看过电影《飞驰人生》，自从看了这个电影，我一直想体验..

关于作者

轻随风之舞..(普通会员)

文章

762

关注

0

粉丝

1

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

04

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

05

OpenAI突发更新！GPT-3.5正式开放微调，人人可打造专属ChatGPT

2023/08/26

标签云

成员 网址收录40373 企业收录2981 印章生成220227 电子证书958 电子名片58 自媒体39805

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索