Llama 2第一、GPT-4第三！斯坦福大模型最新测评出炉-脚本导航

> 自媒体 > （AI）人工智能 > Llama 2第一、GPT-4第三！斯坦福大模型最新测评出炉

Llama 2第一、GPT-4第三！斯坦福大模型最新测评出炉

来源：智东西

2023-11-17 12:55:39

188

管理

开源模型在评级中处于领先地位（图源：CRFM）

团队称，尽管闭源基础模型更容易满足该评级的许多指标，但开源基础模型在许多透明度方面获得了更高的评分。

例如，一些指标评估了下游使用的政策。由于闭源模型通常只通过API提供访问，因此他们可以更容易地分享与下游使用相关的信息，而开源模型的开发商则需要与下游部署者合作才能获得此类信息。

从理论上讲，这意味着闭源模型在这些指标上的得分要高得多，但团队称并没有发现实质性的差别。不过，一些闭源模型开发商在这些指标上的表现确实更好，其中以OpenAI为首。

开源和闭源模型在13个子域评级中的平均透明度评分（图源：CRFM）

总分方面，开源基础模型开发商遥遥领先。

团队认为，开源模型与闭源模型之间的差距是由上游指标造成的，例如开发模型所使用的数据、人力和计算细节。近年来，许多闭源模型开发商对其模型训练方法越来越保密。

三、诉讼、竞争、安全，大模型开发商对于开源的忧虑

《纽约时报》的记者Kevin Roose谈道，当他询问AI公司的高管，为什么不公开分享更多关于他们模型的信息时，通常会得到三种答案。

其一是诉讼。

目前，包括OpenAI在内，已经有多家AI公司被作家、艺术家或媒体公司起诉，指控他们非法使用受版权保护的作品来训练AI模型。

大多数诉讼针对开源AI项目，或是披露了其模型详细信息的项目。AI公司的律师们担心，他们对模型的构建过程说得越多，就越会让自己面临昂贵、恼人的诉讼。

其二是竞争。

大多数AI公司认为，他们的模型之所以有效，是因为他们拥有某种秘诀——其他公司没有的高质量数据集、能产生更好结果的微调技术、能让他们获得优势的某种优化。

他们认为，如果强迫AI公司公开这些“秘方”，就会把他们来之不易的智慧拱手让给竞争对手，让对手轻而易举地复制这些智慧。

其三是安全问题。

一些AI专家认为，AI公司公开其模型的信息越多，AI的进步就会越快，因为每家公司都会看到竞争对手在做什么，并立即尝试通过建立更好、更大、更快的模型来超越他们。

他们认为，如果AI的能力发展得太快，所有人都会处于危险之中，因为社会没有那么多时间来监管和减缓AI的发展。

对此，斯坦福大学的研究人员并不相信这些回答。

他们认为，应该向AI公司施压，让它们尽可能多地发布有关基础模型的信息，因为用户、研究人员和监管机构需要了解这些模型是如何工作的，它们有哪些局限性、危险性。

结语：基础模型社会影响力不断攀升，透明度问题不可忽视

随着基础模型变得越来越强大，AI工具在人们日常生活扮演者愈发重要的角色，模型透明度问题不可忽视。

更多地了解这些基础模型的训练、部署方式，系统的工作原理，构建模型的数据集和数据来源等，将使监管机构、研究人员和用户更好地了解AI系统，对于保持开发商的责任感和了解基础模型的社会影响尤为重要。

AI革命不能在黑暗中进行。如果想让AI改变我们的生活，我们就必须了解它的“黑匣子”。

来源：CRFM、《纽约时报》

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

BCG联手哈佛，史无前例验证GPT-4是把双刃剑，OpenAI总裁转发

2023 AI现状报告：GPT-4仍最强，监管方向缺乏全球共识

相关文章

美国智能机器人 chatgpt 建议哈马斯10招制胜

随着巴以交换人质短暂停火期结束，以色列在加沙屠城行动再次开启。面对世..

缅北诈骗团伙完整“教材”与聊天范例曝光！人设为30多岁白领女性！..

来源：央广网近日，中国之声独家采访了被骗至缅甸诈骗园一年多的中科院..

如何玩转ChatGPT

如何玩转ChatGPT？U姐教育。如何玩转ChatGPT？ChatGPT是一款令人兴奋的人..

创业人物(2) | Open AI 宫斗结束，真实内幕徐徐拉开

从美国当地时间11月17日到21日的5天时间里，在经历了3天3换CEO、萨姆·奥..

聊天，有多大价值？

马拓基层工作其实很有意思，有时候费尽心思都不一定能缓和事主情绪，有时..

OpenAI CEO“世界币”加密货币项目启动，推出配套虹膜扫描硬件..

IT之家 7 月 25 日消息，由 OpenAI CEO 山姆・阿尔特曼共同创办的美国初..

曝光！女老师出轨20多人，聊天记录更是不堪入目。内情曝光！..

#头条创作挑战赛#在山西太原的一位女老师，被她的丈夫发现与一位体育老师..

ChatGPT最强对手Claude，免费还支持中文，怎样使用体验如何？..

一款免费且支持中文的类 ChatGPT 产品 Claude，已经正式上线了。网友们对..

ChatGPT：阶级分化的加速器，打工人的兴奋剂

2022年底，ChatGPT这个AI产品突然火了。铺天盖地的新闻报道和各路专家进..

关于作者

般若鱼(普通会员)

文章

326

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

聊天交友软件常用骗局（套路）交友需小心！

9个月前

02

微信聊天时，女人说“哼哼”，10个高情商回复

7个月前

03

OpenAI突发更新！GPT-3.5正式开放微调，人人可打造专属ChatGPT

8个月前

04

介绍一个能够免费使用国内chatgpt的插件wetab

2023/04/27

05

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

9个月前

标签云

成员 网址收录40329 企业收录2981 印章生成184293 电子证书781 电子名片48 自媒体20029

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索