> 自媒体 > (AI)人工智能 > 王牌竞速:OpenAI的GPT-4被超了
王牌竞速:OpenAI的GPT-4被超了
来源:21世纪经济报道
2025-02-05 19:23:30
51
管理

21世纪经济报道记者孔海丽、实习生张奕丹 北京报道

这场世人瞩目的国际竞赛正趋于白热化。

GPT-4霸占大模型的“王座”已经近一年,距离Mistral拿下“第二名”仅隔一周,新的第一名已经产生。

当地时间3月4日,OpenAI的竞争对手Anthropic,在X上发布了Claude 3最新套系,并且放话:Claude 3在推理、数学、编码、多语言理解和视觉方面建立了新的行业基准。

据Anthropic展示,Claude 3系列在理解能力、数学问题解决能力等方面的得分,几乎全方面碾压GPT-4。

(Claude 3对于诈骗案例的回应 图源:技术报告)

此外,Claude 3的长文本能力依然沿袭了Claude系列的高水准。三个模型都能支持20万token的上下文窗口,在“大海捞针”(分辨集合了不同来源的文档)测试中,Claude 3 Opus表现突出,召回近乎完美。

有实测用户用《红楼梦》电子文档(前二十回)对其进行“插针测试”,Claude 3 Opus用了十几分钟的时间准确找出了用户插入其中的不属于原文的部分,并指出“这些文段和小说并不相关,小说中并没有认真讨论。”

(“大海捞针”的评估 图源:论文)

部分用户已经对Claude 3进行了实测,和GPT-4进行多方比较,二者各有所长。但总体来看,一部分网友还是相当看好Claude 3。尽管目前Claude 3在某些方面还不太稳定,但是基于其进步之迅速、亮点之繁多,“Claude 3值得”已经成为了潜在会员们的心声。

而在Claude 3背后的Anthropic,或许也在感慨,“出走”三年,这回终于得以在OpenAI面前扬眉吐气。

大模型的“枪林弹雨”

无论是Anthropic推出的Claude 3,还是法国AI新贵Mistral AI推出的Mistral Large,都在近期向外界证明了一个道理:OpenAI并不是难以追及的,甚至,Claude 3在多项得分上已经超过了GPT-4。

从技术到应用,大模型的竞争已经越来越垂直,“百模大战”已经不再是“抢占先机”的时期。无论是巨头还是初创公司,谁的大模型应用更强大,谁才能俘获用户的付费。

Anthropic创始团队早期参与了GPT系列的开发。由于在OpenAI的发展方向上产生分歧,担心微软对OpenAI首次10亿美元的投资后,会使其走上更加商业化的道路,偏离其最初对高级AI安全性的关注,负责OpenAI研发的研究副总裁达里奥·阿莫迪 (Dario Amodei)和安全政策副总裁丹妮拉·阿莫迪(Daniela Amodei)决定离职,创立一家与OpenAI有不一样价值观的人工智能公司。

这次的“出走”使得Anthropic在2021年成立。团队有一个很明确的目标,就是构建一套可靠、可解释、可控的“以人类(利益)为中心”的人工智能系统。

(图源:Anthropic官网)

脱胎于OpenAI的Anthropic,在技术上给OpenAI带来的威胁一直存在。2023年2月,Anthropic获得谷歌投资3亿美元,成立2年后即发布了类似ChatGPT的AI对话系统Claude。之后在融资中筹集了大量资金,并于2023年9月获得了亚马逊40亿美元投资。

近日,OpenAI深陷马斯克起诉风波,从当年“造福人类”的初衷,到如今网友对“OpenAI”和“ClosedAI”的调侃,考验着OpenAI掌舵人关于初心与商业化平衡的艺术。

Anthropic和OpenAI的竞争如此,整个大模型的赛道更是如此。有网友评论,大模型的集中爆发,已经不是“让子弹再飞一会儿”了,而是枪林弹雨满天飞,现在就看谁在特定应用场景的纵深度上走得快了​。

AI大模型的研发和迭代已成定势,提供更好的应用体验和应用场景,是所有玩家2024年要俯身下去解决的问题。

在Anthropic的评论区,有网友直接喊话OpenAI:“现在你可以发布GPT-5了”。也有传闻称GTP-5已经研发完成,届时Claude 3与GPT-5的对决,亦或是更多大模型在应用实力上的长期对决,值得期待。

更多内容请下载21财经APP

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
全球首个开源GPT-4出世!Llama 3震撼发布,Meta AI免登录可用..
编辑:编辑部【新智元导读】蛰伏许久,Meta刚刚扔出了重磅炸弹:大家期待..
讯飞星火大模型V4.0体验:全面进化,体验不输GPT-4o
在 6 月 27 日举办的讯飞星火 V4.0 发布会上,科大讯飞发布了讯飞星火大..
芝大论文证明GPT-4选股准确率高达60%,人类股票分析师要下岗?..
编辑:编辑部【新智元导读】GPT-4在为人类选股时,表现竟然超越了大部分..
大模型开车哪家强?普渡研究给指南:GPT-4真行啊
白交 发自 凹非寺量子位 | 公众号 QbitAI现在一句口令,就能指挥汽车了。..
谷歌:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了..
编辑:Aeneas 好困【新智元导读】刚刚,谷歌DeepMind、JHU、牛津等发布研..
潞晨尤洋:视频生成的GPT-4时刻,3年后可以见证 | MEET 2025..
编辑部 发自 凹非寺量子位 | 公众号 QbitAI奥特曼说,Sora代表了视频生成..
通义千问GPT-4级主力模型降价97%,1块钱200万tokens
5月21日,阿里云方面宣布,通义千问GPT-4级主力模型Qwen-Long,API输入价..
一夜封神!Llama 3.1大模型震撼发布,真正的全民GPT-4时代来了..
Meta更新了许可证,允许开发人员首次使用包括405B参数规模的Llama模型的..
OpenAI的GPT-4,被超了!
作 者丨孔海丽这场世人瞩目的国际竞赛正趋于白热化。GPT-4霸占大模型的“..
关于作者
聚焦每日新资..(普通会员)
文章
893
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40386 企业收录2981 印章生成229714 电子证书1008 电子名片58 自媒体46281

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索