> 自媒体 > (AI)人工智能 > GPT-4揭秘:这个比太阳还热的神经网络架构是怎么做到的?
GPT-4揭秘:这个比太阳还热的神经网络架构是怎么做到的?
来源:小毛AI
2023-07-14 17:19:09
355
管理

OpenAI最近宣布了他们的最新语言模型GPT-4,这是一个拥有1.8万亿个参数的神经网络巨人,比GPT-3大了10倍以上。GPT-4不仅在文本生成方面表现出惊人的能力,还能处理多模态视觉任务,如图像和视频的理解和转录。GPT-4的架构、基础设施、训练数据集、成本、愿景和专家混合(MoE)等方面的细节一直被OpenAI保密,但我们从多个来源收集了一些信息,并在这篇文章中与大家分享。我们将从以下几个方面来分析GPT-4的特点和创新:

视觉

GPT-4不仅是一个文本模型,还是一个多模态视觉模型,能够处理图像和视频的理解和转录。它是与文本编码器分开的视觉编码器,具有交叉注意力。该架构类似于Flamingo。这在GPT-4的1.8T之上增加了更多参数。在仅进行文本预训练之后,它又使用约2万亿个令牌进行了微调1。这种视觉功能的主要目的之一是让自主代理能够阅读网页并转录图像和视频中的内容1。他们训练的一些数据是联合数据(渲染的LaTeX/文本)、网页屏幕截图、YouTube视频:采样帧,并围绕它运行Whisper以获得转录本。

MoE

专家混合(MoE)是一种将模型分解为多个专家子模型的方法,每个专家子模型只处理输入的一部分,从而降低计算和内存开销。MoE模型的优点是可以大幅提高模型的规模和效率,同时保持较低的训练成本。MoE模型的缺点是推理时利用率较低,因为并非每次生成一个令牌时都会使用模型的所有部分。这意味着当其他部件正在使用时,部件可能会处于休眠状态。在服务用户时,这确实会损害利用率。

OpenAI通过利用MoE模型能够将GPT-4的成本保持在合理水平。他们在模型中使用了16位专家,每个专家大约有111B个MLP参数。每个前向传递都会路由其中2名专家。虽然文献中大量讨论了用于选择将每个代币路由到哪些专家的高级路由算法,但据称对于当前的GPT-4模型来说,OpenAI的算法相当简单。

研究人员表明,使用64到128名专家比使用16名专家可以实现更好的损失,但这纯粹是研究结果。选择较少的专家有多种原因。OpenAI选择16名专家的原因之一是因为更多的专家很难在许多任务上进行泛化。更多的专家也可能更难以实现收敛。面对如此大规模的训练,OpenAI相反选择在专家数量上更加保守。

总结

GPT-4是一个拥有1.8万亿个参数的神经网络巨人,比GPT-3大了10倍以上。GPT-4不仅在文本生成方面表现出惊人的能力,还能处理多模态视觉任务,如图像和视频的理解和转录。GPT-4采用了专家混合(MoE)模型,这是一种将模型分解为多个专家子模型的方法,每个专家子模型只处理输入的一部分,从而降低计算和内存开销。GPT-4还使用了多查询注意力(MQA)、张量并行和管道并行等技术来提高模型的效率和规模。GPT-4在约13T令牌上进行训练,其中包括公开和私有的文本、图像和视频数据。GPT-4还拥有一个与文本编码器分开的视觉编码器,能够处理多模态视觉任务,如图像和视频的理解和转录。

GPT-4是一个令人惊叹的语言模型,它展示了神经网络的强大能力和潜力。它也是一个极具挑战性的工程项目,它涉及了许多复杂的权衡和创新。GPT-4的架构、基础设施、训练数据集、成本、愿景和专家混合等方面的细节一直被OpenAI保密,但我们从多个来源收集了一些信息,并在这篇文章中与大家分享。我们希望这篇文章能够帮助大家更好地理解GPT-4的特点和创新,以及它对人工智能领域的影响和意义。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
昔日销冠跌出前十,长城汽车魏建军的焦虑与反思
赵永坡也在社交平台上介绍:“哈弗H6车型是国内最早一批可以实现OTA升级..
汽车资讯∣上汽大众全新途观L PRO上市;丰田新款皇冠陆放上市..
◆ 上汽大众途观L PRO售价23.68万元起5月30日,上汽大众全新途观L PRO正..
汽车电瓶能用几年?瓦尔塔、骆驼、风帆怎么选?一次性给你讲清楚..
咱们汽车上都有一个小电瓶,这个小电瓶的作用就是用来启动发动机的,一旦..
试驾全新福特Mustan-性能拉满的大玩具
外形方面,第七代福特Mustang的车顶线条更加低矮,大灯造型也变得更加狭..
未来10年,5大汽车品牌或将挥手告别中国,想买这些车的避免踩坑..
在这个汽车工业飞速演进的时代,中国,这片充满活力与挑战的土地,已悄然..
2024年国际汽车新材料大会落幕
光明网讯5月31日,由中国汽车工程学会、汽车轻量化技术创新战略联盟、芜..
全面拥抱智能化 试驾上汽大众途观L Pro
【太平洋汽车 评测频道】一代神车途观上新啦!这也是途观的第三代车型,..
新车 | 50万元级别插混中大型SUV 方程豹汽车豹8亮相2024粤港澳车展..
文:懂车帝原创 曹浩[懂车帝原创 产品] 6月1日,2024粤港澳大湾区车展开..
没测完就开卖?汽车耐久性测试怎么才算合格?
最近,雷总在直播中透露,小米SU7的测试车目前还在测试中,而且还准备每..
关于作者
清水大树(普通会员)
文章
1086
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40404 企业收录2983 印章生成238877 电子证书1061 电子名片60 自媒体58439

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索