> 自媒体 > (AI)人工智能 > 首个开源MoE大模型发布!GPT-4同款架构,来自欧洲的OpenAI
首个开源MoE大模型发布!GPT-4同款架构,来自欧洲的OpenAI
来源:量子位
2023-12-11 16:39:27
237
管理

梦晨 发自 凹非寺量子位 | 公众号 QbitAI

“取消今晚所有计划!”,许多AI开发者决定不睡了。

只因首个开源MoE大模型刚刚由Mistral AI发布。

AlpacaEval上,也排到第15。

目前这个新的MoE模型连个正式名字都还没有,社区一般称呼它为Mistral-7Bx8 MoE。

但在大家期待的期待中,新MoE模型对比单体Mistral-7B的提升幅度,就应该像GPT-4对比GPT-3.5那样。

但是注意了,有人提醒大家MoE对于本地运行来说不是太友好,因为更占内存

但更适合部署在云端,跨设备专家并行,给公司处理并发需求带来成本优势。

Replicate上也有了可试玩版本,简单试用发现中文水平也不错。

三位联合创始人中,CEO Arthur Mensch此前在DeepMind巴黎工作。

CTO Timothée Lacroix和首席科学家Guillaume Lample则在Meta共同参与过Llama系列的研发,Lample是通讯作者之一。

Arthur Mensch曾在接受采访时谈到,让模型变小是支持Agent发展的路径之一。

如果能把计算成本降低100倍,就能构建起更多有意思的应用。

不少人都拿来和最近谷歌的过度宣传做对比。

最新的梗图:磁力链接就是新的arXiv。

参考链接:[1]https://x.com/MistralAI/status/1733150512395038967?s=20[2]https://github.com/mistralai/megablocks-public[3]https://replicate.com/nateraw/mixtral-8x7b-32kseqlen

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
ChatGPT 们难以复制的原因,除了耗显卡,还有水电费太贵?..
不过,如此简单的形式,却成为了当下网络上和现实里最火热的话题,果然「..
GPT4来了:写作行业已被颠覆,一小时就可以写一篇5000字小说..
GPT4出来的时候,我一直在思考如何向我的粉丝朋友做个介绍。看了网上的各..
ChatGPT和国际物流能扯上关系吗?
2016年区块链大火,一夜之间,所有信息公司都可以实现去中心化了,且不说..
曼谷老白账号神秘消失,曾被胡七刀指控为“蛇头”,更多细节曝光..
本文内容来自于网络,若与实际情况不相符或存在侵权行为,请联系删除。原..
中国支付清算协会倡议:支付行业人员谨慎使用ChatGPT
【CNMO新闻】随着ChatGPT的爆火,其功能被逐步拓展,使用ChatGPT有可能造..
这次的open AI董事会开除创始人兼CEO奥特曼...
这次的open AI董事会开除创始人兼CEO奥特曼?大家这个周末,一直都围绕三..
GPT-4外逃计划曝光!斯坦福教授发现它正引诱人类帮助,灭绝之门..
GPT-4:人工智能的崛起与终极威胁近日,一则震惊世界的消息传出:GPT-4,..
新版上线流量太惊人,ChatGPT服务器崩了:CEO道歉后,又被攻击了..
AI(人工智能)巨头OpenAI在首届开发者大会上宣布了一系列新功能后,Chat..
丝袜门事件再反复:涉事人员称账号被盗,网传新聊天记录显示..
如果您喜欢本篇文章,劳驾点击右上方的“关注”以增加您的阅读体验,同时..
关于作者
御赐铲屎官..(普通会员)
文章
362
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成187881 电子证书798 电子名片49 自媒体21260

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索