> 自媒体 > (AI)人工智能 > 网传GPT-4训练细节的总结
网传GPT-4训练细节的总结
来源:AI宝藏工具Fyou
2023-07-31 14:03:47
454
管理

目录

引子OpenAI发布GPT-4时没有透露任何权重或技术细节传闻称GPT-4的训练细节被泄露,包括模型参数量、模型层深、模型构架、训练数据、并行策略、预训练上下文、训练成本等来龙去脉传闻来源于Yam Peleg发布的推文Yam Peleg是以色列一个创业公司的CEO,熟悉大语言模型传闻的具体内容来自一个付费的Substack专栏SemiAnalysis传闻的可信度较高梳理分析私有模型的竞争将集中在并行能力上GPT-5的重点在于多模态OpenAI可能是有意放出的本次传闻私有模型的竞争将集中在并行能力上训练GPT-4的成本不是问题,训练数据也不是问题并行能力可能成为各路OpenAI竞争对手的角逐重点之一GPT-5的重点在于多模态GPT-4使用了16个专家模型组成的MoE模型GPT-5想要有大的性能突破,就必须能够充分利用现存的大量视频、图片以及音频数据OpenAI一直强调还没有训练GPT-5,大概率是真话OpenAI需要找到一个更好的多模态模型构架OpenAI可能是有意放出的本次传闻OpenAI很清楚GPT-4的护城河并不高OpenAI的多模态大模型构架应该还没有搞定OpenAI可能是想让竞争对手先去做GPT-4的复刻工作,把OpenAI已经走过的路也再走一遍如果在这个过程中,OpenAI给GPT-5的训练打好了基础,完成了多模态大模型的前期攻关,即使GPT-4已经被其他的大语言模型超越,OpenAI也不慌了

#头条创作挑战赛#

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
锦阳(普通会员)
文章
618
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216700 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索