GPT-3 1750 亿模型参数分布解析？-脚本导航

> 自媒体 > （AI）人工智能 > GPT-3 1750 亿模型参数分布解析？

GPT-3 1750 亿模型参数分布解析？

来源：机器学习搬运工

2023-08-04 15:38:59

479

管理

GPT-3 1750 亿参数，已经不是一般机构玩转的动，要分析GPT-3 参数构成，我们先分析 Transformer 中核心结构由encoder-decoder 构成，当前的LLMs模型基本是encoder 结构或者decoder 结构，而一个encoder 块，由Mutil-Head-Attention 和FFN 构成,然后在这中间，LayerNorm 穿插其中，下面主要从这三部分进行解析：是模型的输入/输出维度（单词的嵌入embedding 维度）

表示模型的前馈神经网络FFN隐藏层维度；

表示注意力头的个数

表示注意的层数

1.Mutil-Head-Attention

GPT-3 相关结构参数

从这个表中可以看出，在训练GPT-3规模上，参数规模越大，barch 越大，学习率越小。

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

为何重视通用人工智能发展

2023-08-04 15:57

GPT-4还没普及 GPT-5这就要来了：AI领域无敌手

2023-08-04 15:29

相关文章

贼贵的CHAT GPT-4今天发布

今天微软下午开始CHAT GPT-4产品演示发布会，但是价格比前代GPT-3 贵了近..

GPT-4在图灵测试中惨败，60年前老AI笑而不语，人类胜率仅有63%！..

在数十年的技术演进和人工智能领域的不懈努力中，GPT-4近日未能通过图灵..

AI系统审查更严！ChatGPT禁令解除后，意大利监管机构这样做..

意大利数据保护机构表示，继迫使ChatGPT做出改变以遵守隐私规则的临时禁..

微软接入GPT-4后首份成绩单！智能云、Bing、Office杀疯了..

作者 | 李水青编辑 | 心缘今日凌晨，美国科技巨头微软发布了接入OpenAI的..

ChatGPT爆火后，青岛主动做了这件事

风口财经记者娄花ChatGPT横空出世掀起了人工智能的新浪潮，作为国家人工..

生成内容属于谁？会侵权泄密吗？ChatGPT法律风险详解

近期，美国OpenAI公司旗下的人工智能聊天机器人ChatGPT一跃成为火爆全球..

营销人员应如何正确利用ChatGPT？

ChatGPT的能力已经得到了大面积的认可，它对营销工作会有怎样的帮助呢？..

梅赛德斯-奔驰宣布将车载语音助手接入ChatGPT AI聊天机器人..

IT之家 6 月 16 日消息，梅赛德斯-奔驰周四表示，将于 6 月 16 日开始测..

谷歌发布最大语言模型：等于9个GPT-3，训练成本却低得多..

杨净发自凹非寺量子位报道 | 公众号 QbitAI今天，谷歌大脑声称，他们..

关于作者

杨子(普通会员)

文章

623

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

04

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

05

OpenAI突发更新！GPT-3.5正式开放微调，人人可打造专属ChatGPT

2023/08/26

标签云

成员 网址收录40369 企业收录2981 印章生成216707 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索