> 自媒体 > (AI)人工智能 > 闪电快讯丨Meta免费公开AI模型,1750亿参数和GPT-3相当
闪电快讯丨Meta免费公开AI模型,1750亿参数和GPT-3相当
来源:界面快讯
2023-04-11 13:46:16
413
管理

记者 汤一涛

5月3日,Facebook的母公司Meta在它的博客上免费公开了一套LLMs(大型语言模型)——OPT-175B。该公司称这项努力是透明度的实践,是其开放科学承诺的一部分。

LLMs 是基于自然语言处理(NLP)和超过1000亿个不同参数的人工智能训练模型。过去几年,LLMs被广泛运用在了算法开发、生成创造性的文本、数学问题的解决和文本理解上。

衡量LLMs能力的一个重要标准就是参数数量。OPT-175B模型有超过1750亿个参数,和当前世界参数量最大的GPT-3相当。但相比GPT-3,OPT-175B的优势在于它是完全免费的,这使得更多缺乏相关经费的科学家们可以使用这个模型。

同时,Meta 还公布了代码库、开发过程日志、数据、研究论文和其他与OPT-175B相关的信息,希望有更多的社区参与到这个项目中。Meta AI的常务董事乔尔·派诺(Joelle Pineau)告诉美国科技媒体Protocol:“当然,在训练LLMs方面,其它人已经走在了我们前面,并且在某些情况下提供了API。但这些模型的代码和训练模型还没有公布给更广泛的研究团体。”

OPT-175B结合了预训练模型和培训代码,目前从1.25亿到330亿参数的版本都可以免费下载到本地适应,而1750亿参数的版本必须手动申请。

这些模型在一系列开源数据集上接受了训练,包括数千本未出版的书籍和多年来在网上搜集的数据,以完成一系列标准语言模型任务,包括自然语言生成和对话、检测偏见和仇恨言论。

但Meta没有使用任何Facebook或者Instagram的用户数据来训练OPT-175B。“因为我们的目标是能够公开发布模型和相关文档给 AI研究机构。这是我们对可访问、可复制和透明科学的承诺的一部分。”派诺说

通常LLMs的运行需要消耗大量算力,这也是LLMs经常为人所批评的地方。但Meta在OPT-175B的论文中表示,其模型开发的碳排放量为75吨,大约是GPT-3(500吨)的1/7。在具体的算力需求上,OPT-175B只需要16个Nvidia V100 GPU就可以运行。

尽管OPT-175B是免费的,但Meta确实给出了一些限制。为了防止误用和“保持完整性”,OPT-175B只允许在非商业用途下使用。也就是说,OPT-175B的多数应用场景还是在科研上。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
无根草(普通会员)
文章
427
关注
0
粉丝
2
点击领取今天的签到奖励!
签到排行

成员 网址收录40335 企业收录2981 印章生成193716 电子证书831 电子名片53 自媒体26178

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索