> 自媒体 > (AI)人工智能 > 人称“GPT-4最强平替”的Llama 2,究竟厉害在哪里?
人称“GPT-4最强平替”的Llama 2,究竟厉害在哪里?
来源:智东西
2023-08-26 15:47:37
499
管理

智东西

编译 | 铭滟

编辑 | 徐珊

智东西7月26日消息,据The Information报道,Llama 2与GPT-4在性能与成本方面各有优势。除此之外,虽然Llama 2为免费商用的开源模型,但大模型的创建过程还需要专业人员操作。Llama 2的发布也激发了AI爱好者的积极讨论与应用。

在性能方面,根据大规模多任务语言理解的基准测试,GPT-4和GPT-3.5的表现均优于Llama 2;在训练成本方面,Llama 2的700亿参数模型则通过分组机制降低成本,且同时还可以处理更多请求。上周Meta正式发布Llama 2后,Llama 2强大的参数规模以及性能表现,对OpenAI带来了不小的压力,人称为“GPT-4最强平替”。

Llama 2作为Meta发布的首个免费商用的开源大模型,这并不等于各个商业公司可以自行创建大语言模型(LLM)。使用开源AI模型构建LLM和聊天机器人仍需要专业人员完成。

一、比起GPT-4,Llama 2的优势在哪里?

The Information称Llama 2的发布是Meta的夺权之作,因为几乎每家公司都可以选择收费商用,但Meta选择免费商用。OctoML的联合创始人Jason Knight认为,Llama 2将抢夺OpenAI旗下GPT-4的市场份额,OctoML是一家机器学习(ML)模型优化和部署的平台公司。

但OpenAI或将推出与Llama 2对标的开源商用LLM,据The Information消息,OpenAI未发布模型的代号是G3PO,但尚未有消息表明它将于何时发布。考虑到OpenAI的员工数量,新模型的发布或将延迟。

The Information称,OpenAI将开发一种闭源模型与开源模型的混合体,前者用于营收,后者仍将向开发者开放,并吸引开发者为闭源模型付费。目前,扎克伯格并未对此消息作出进一步表示。

Llama 2大模型有70亿、130亿、700亿三个参数规模版本。参数是指大模型在训练过程中用来对所学内容进行编码的参数,参数数量越大,模型复杂性越高,对服务器的性能要求也越高。较小的模型运行起来更快更轻松,较大的模型更适合复杂推理任务。

图为Llama 2大模型70亿、130亿、700亿三个参数规模版本介绍

与其他LLM相比,Llama 2在性能方面表现居中。根据大规模多任务语言理解(MMLU,一种常用的文本模型基准),Llama 2的700亿参数模型在数学和编码等各种任务上的表现优于MosaicML预训练转换器(MPT)和阿联酋阿布扎比的技术创新研究所(Technology Innovation Institute)的Falcon。但Llama 2的表现略落后于OpenAI的GPT-3.5,在编码基准方面,两者有很大差距。与GPT-4和谷歌的Pathways Language Model(PaLM)2(Bard聊天机器人的运行基础)相比,Llama 2的性能差距更大。

在训练和使用AI模型的成本方面,Llama 2的表现则优于其他LLM。Llama 2的700亿参数模型中使用了分组查询注意机制(Grouped-Query Attention,GQA)。GQA是一种降低LLM内存需求的建模技术。这一技术可以降低每一字节的计算成本,使得LLM能同时处理于更多的请求。如今这一点变得越发重要,因为训练和使用AI模型的成本激增。以GPT-4为例,它的训练费用就超过了1亿美元。

二、商用免费后,公司还需要花钱买LLM吗?

Llama 2发布后,似乎每家公司都可以自行创建LLM和聊天机器人了。但这没有想象中那么简单。使用开源AI模型构建LLM和聊天机器人需要多重步骤,包括托管模型、构建聊天机器人用户界面、以模型路径存储专有数据,以及微调模型。这些都是费时费力的工作,即使是Databricks等销售AI模型工具的公司也需要数据科学家来完成这项任务。

然而,AI从业者和爱好者已经开始互帮互助,共同开发Llama 2。Reddit社区上充斥着各种教程,从如何告诉模型要生成什么东西,到教人们个性化设置Llama聊天机器人。与此同时,GitHub上的Ollama也发布脚本,辅助用户在笔记本电脑上本地运行Llama 2,这也让更多的人可以使用Llama 2。

图为Reddit社区Llama 2讨论区

Meta此举还将提升提供应用程序和服务器的公司的估值,因为此类公司能够辅助运行人工智能模型。据多位知情人士透露,Modal最近以1.5亿美元的税后估值获得了Redpoint Ventures的资助,该公司主营业务为帮助开发者在线上运行人工智能应用程序代码。Redpoint发言人兼Modal首席执行官拒绝置评。

结语:Meta的开源之举或将影响AI领域生态

Llama 2的发行吸引了AI业内大量的关注,为Meta在AI领域的后续发展提供了难得的机会。Meta的免费开源之举可能会给业内带来一个蓬勃发展的开发者生态,开发者可以免费改进各项应用软件。

对于包括OpenAI在内的其他AI企业来说,Meta的行为是否会改变他们的产品发布节奏?或者影响其内部战略决策?对此,我们也会持续关注。

来源:The Information

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
这种“爆料吃瓜群”慎入!
为了吸粉引流增加自己账号的粉丝数量有人利用公众猎奇吃瓜的心理编造虚假..
如何与女生聊天?聊天技巧有哪些?
对于恋爱新手来说,非常头疼的事情,莫过于怎么和女生聊天。很多男生不会..
ChatGPT是什么?能做什么?怎么能用好?看这一篇就足够了!..
继“疫情”和“俄乌战争”之后,2023上半年,火遍全球的名词非“ChatGPT..
GPT-4就是AGI!谷歌斯坦福科学家揭秘大模型如何超智能..
编辑:编辑部【新智元导读】谷歌研究院和斯坦福HAI的两位专家发文称,现..
日本Trippy利用ChatGPT模拟动漫人物性格,打造聊天机器人..
据headtopics网站 5月25日报道,日本Trippy将于5月29日发布利用ChatGPT技..
“这真令人不寒而栗”,ChatGPT编造法学教授性骚扰丑闻..
·澳大利亚Hepburn Shire市长布赖恩·胡德威胁要对OpenAI提起诽谤诉讼,..
“闲鱼”APP竟然暗藏色情陪聊等服务入口,记者揭秘这里面的内幕..
在阅读此文之前,辛苦点击右上角的 “关注”,既方便您进行讨论与分享,..
OpenAI在美国推出iOS版的免费ChatGPT应用程序
为了增强ChatGPT的竞争力,OpenAI在美国发布了一款免费的ChatGPT应用程序..
OpenAI CEO山姆·阿尔特曼携手创始人推出Worldcoin:解决生成式人工智能挑..
驱动中国2023年7月26日消息,近日,Worldcoin项目联合创始人包括OpenAI C..
关于作者
经典好看视频..(普通会员)
文章
560
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40350 企业收录2981 印章生成210491 电子证书900 电子名片56 自媒体30867

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索