Meta复刻GPT-3“背刺”OpenAI，完整模型权重及训练代码全公开-脚本导航

> 自媒体 > （AI）人工智能 > Meta复刻GPT-3“背刺”OpenAI，完整模型权重及训练代码全公开

Meta复刻GPT-3“背刺”OpenAI，完整模型权重及训练代码全公开

来源：量子位

2023-05-01 18:55:10

420

管理

梦晨萧箫发自凹非寺量子位 | 公众号 QbitAI

千亿级参数AI大模型，竟然真的能获取代码了？！

一觉醒来，AI圈发生了一件轰动的事情——

Meta AI开放了一个“重达”1750亿参数的大语言模型OPT-175B，不仅参数与GPT-3的1750亿一样，效果还完全不输GPT-3——

Meta AI对此解释称，OPT就是奔着开放代码去的，为了让更多人研究大模型，环境配置肯定是越经济越好。

这不，运行时产生的碳足迹连GPT-3的1/7都不到，属实省能又高效。

为了方便研究人员“量力而行”，Meta AI搞出了各种大小的OPT模型，从125M参数到1750亿参数的不同大小模型都有。

其中，660亿参数的模型还在制作中，马上也会和大伙儿见面：

所以，最大的OPT-175B模型究竟有多高效，又是怎么做到的？

性能方面，Meta AI针对OPT-175B和GPT-3，用14个NLP任务进行了测试。

结果表明，无论是零样本学习（zero-shot）还是多样本学习（Multi-shot），OPT在这些任务上的平均精度都与GPT-3相差不大。其中虚线为GPT，实线为OPT：

仇恨言论检测任务上的效果，更是完全超过Davinci版本的GPT-3模型（在GPT-3的四个版本中是效果最好的）：

研究人员表示，希望能在开放后，有更多人参与进来研究，并真正解决这些问题。

手把手教你复刻GPT-3

上面提到，这一次的OPT模型系列，300亿参数及以下的版本都是可以直接下载，660亿版还在路上。

只有完整的1750亿版需要额外填写一张申请表，包括工作单位、用途、相关发表工作等问题。

斯坦福大学基础模型研究中心主任、副教授Percy Liang对此发表了观点，将大模型的开放程度总结成4个层次，更高层次的开放能让研究者专注于更深的问题。

第一层论文开放，证明一些设想的可行性，并提供构建思路。

第二层API开放，允许研究人员探索和评估现有模型的能力（如推理能力）和限制（如偏见）

第三层模型权重开放和训练数据开放。允许研究人员逐步改进现有模型，开发更深入的可解释性技术和更有效的微调方法，让研究人员更好地理解训练数据在模型行为中的作用。

第四层计算能力开放，允许研究人员尝试新的体系结构、训练目标和过程、进行数据融合，并在不同的领域开发全新的模型。

Percy Liang认为更高层次的开放同时也会带来更多风险。

也许是时候制定相关的社区规范了？

One More Thing

Meta这次论文的的共同一作有三人，其中Susan Zhang加入Meta之前正是来自OpenAI。

不过在OpenAI期间她并没有负责GPT-3的开发，而是参与了玩Dota的OpenAI Five强化学习项目，以及多模态大模型的研究。

项目地址：https://github.com/facebookresearch/metaseq/tree/main/projects/OPT

论文地址：https://arxiv.org/abs/2205.01068

参考链接：[1]https://ai.facebook.com/blog/democratizing-access-to-large-scale-language-models-with-opt-175b/[2]https://www.technologyreview.com/2022/05/03/1051691/meta-ai-large-language-model-gpt3-ethics-huggingface-transparency/[3]https://twitter.com/MetaAI/status/1521489996145958914

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

GPT-3是否会取代人类写手

2023-05-01 18:56

ChatGPT背后：一个天才、百亿融资和1亿日活 | 全球独角兽

2023-05-01 18:53

相关文章

英语口语是“ChatGPT”教的！当AI老师进课堂，孩子们的学习方式大变样..

“What is a good diet?”甩掉课桌椅、席地而坐，孩子们在最贴近日常的生..

ChatGPT突然“断网”因为白嫖付费内容丨阿里发布大模型评测方法..

AI奇点网7月5日综合报道丨账号全网同名谷歌更新隐私政策：告知用户，将会..

团伙养了17万个QQ号专为“裸聊”

以35元至100元不等的价格对外出售QQ账号文图/本刊记者余东明张海燕在3..

范式的转变：一个 AI 产品经理对类 ChatGPT 产品形态的思考..

最近大家都很兴奋，ChatGPT的出现带火了知识博主，增加了变现机会。很多..

惊呆！GPT-4“越狱”计划曝光，引诱人类帮助

刚刚发布5天的GPT-4，掀起了一场轩然大波。一位斯坦福大学教授最新发现，..

惊呆了！这些“网红”可能都是假人......

Ins、抖音上的网红一定都是真人吗？答案还真不一定。最近国外出现了一批..

AI加持，openEuler打造数字基础设施全场景操作系统

面向智能新时代openEuler使能AI更高效在过去的四年里，openEuler社区快速..

游涛丨语聊平台在“1v1陪聊”诈骗中的刑事责任简析

何为“1v1陪聊”？所谓“1v1陪聊”，是一种陌生人之间通过网络平台一对一..

两个老外假装中国人说中文，不仅自己红了，还一起带火了这游戏？..

大家好，这里是正惊游戏，我是正惊小弟！说到VR（虚拟现实）游戏，大家可..

关于作者

轻随风之舞..(普通会员)

文章

640

关注

0

粉丝

1

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

04

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

05

OpenAI突发更新！GPT-3.5正式开放微调，人人可打造专属ChatGPT

2023/08/26

标签云

成员 网址收录40369 企业收录2981 印章生成216706 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索