> 自媒体 > (AI)人工智能 > Claude 3全面碾压GPT-4成最强大模型?《科创板日报》记者实测报告来了!
Claude 3全面碾压GPT-4成最强大模型?《科创板日报》记者实测报告来了!
来源:科创板日报
2025-02-06 15:41:52
94
管理

《科创板日报》3月5日讯(记者 朱凌)一款被认为碾压GPT-4的模型火了!近日,Anthropic发布Claude 3系列模型,该公司称这是迄今为止速度最快、功能最强大的人工智能模型。

据了解,Claude 3模型系列包括三个模型,按能力升序排列依次是:Claude 3 Haiku(中杯)、Claude 3 Sonnet(大杯)、 Claude 3 Opus(超大杯)。

同时,Claude 3是多模态大模型,具有强大的“视觉能力”,用户可以上传照片、图表、文档和其他类型的数据,对其进行分析和提问。

该公司表示,新模型中能力最强的Claude 3 Opus在部分行业基准测试中的表现优于OpenAI的GPT-4和谷歌的Gemini Ultra,如本科生水平的知识、研究生水平的推理和基础数学。

▍Claude 3 Opus VS GPT-4:未具备明显优势

《科创板日报》记者第一时间对Claude 3 Opus进行测试,并与GPT-4进行对比。

首先,对于Claude 3宣称的视觉能力,《科创板日报》记者注意到,相比于GPT-4,Claude 3 Opus确实在图片识别上会有更多细节表现,但在准确率上表现仍不佳。

为验证视觉水平,《科创板日报》记者上传华为Mate50的手机宣传图,并分别对Claude 3 Opus和GPT-4进行提问:这是什么手机?

其中,Claude 3 Opus以肯定的回答这是华为Mate系列的产品,并分别对图中三个手机进行描写,但均将其错认成“Mate40”。

而GPT-4则表示无法识别出具体型号,不过,其提到“华为Mate系列在过去曾使用过类似的设计布局”。

《科创板日报》记者以“鲁迅为什么打周树人”为题目,分别测试Claude 3 Opus和GPT-4,两者都能做出正确回答。

最后,《科创板日报》记者以“只切一刀,如何把四个橘子分给四个小朋友?”为问题,分别测试Claude 3 Opus和GPT-4。

其实这道题是一个小陷阱,考验模型的常识和推理能力,GPT-4虽然没有犯下如Claude一样的严重错误,但也没有绕过题目本身的推理陷阱。这道题的正确答案很简单:只要每个小朋友分到一个完整的橘子就可以了,根本不需要切开。

综上,记者的实测结果显示,Claude 3并未超越GPT4。

▍Anthropic是谁?

实际上,这家与ChatGPT-4媲美的大模型公司仅成立不到3年,值得一提的是,该公司核心成员的老东家正是ChatGPT-4的开发商OpenAI。

其中,Anthropic的两位创始人Dario Amodei和Daniela Amodei兄妹,离任前分别在OpenAI担任研究部门副总裁和安全与策略部门副总监。同时,Dario Amodei离任时还带走了OpenAI十多名心腹,其中就包括GPT-3首席工程师Tom Brown。

强大的团队阵容让Claude一路狂飙。据了解,在ChatGPT推出不久后的2023年3月,Anthropic就发布了首款名为“Claude”的AI助手。 彼时,这款类似于ChatGPT的产品让该公司一度被认为是Open AI的最大竞争对手。

光环之下,Anthropic受到资本追捧。据了解,仅2023年一年这家初创公司就完成了五笔不同的融资交易,总计约73亿美元,投资方包括谷歌、亚马逊、Salesforce以及韩国SK Telecom。其中,亚马逊和谷歌分别向其投资高达40亿美元和20亿美元。

公司规模来看,Anthropic联合创始人丹妮拉-阿莫迪(Daniela Amodei)在接受采访时说,目前该公司有60到80人从事核心人工智能模型的开发,总共有120到150人从事技术方面的工作。

据Anthropic公司称,Claude 3 Sonnet和Opus从下周一开始在159个国家上市,而Haiku将很快上市。

有业内人士向《科创板日报》记者表示,随着此轮Claude 3的热度,预计大模型行业会进入一轮新的厮杀。不过,其提醒,Claude3是与OpenAI一年前的模型的比较,而GPT-5预计今年发布,其的性能或将上新台阶。

根据PitchBook的数据,在过去一年里,生成式人工智能领域出现了爆炸式增长,2023年近700笔交易的投资额达到了创纪录的291亿美元,交易额同比增长超过260%。

其中,OpenAI曾在去年4月完成103亿美元的大额融资。近期亦有消息称OpenAI正在寻求新的融资,如果有竞争对手能力超过OpenAI,或对OpenAI的融资产生影响。

此外,主张开源策略的Meta在今年1月宣布,Meta AI已经开始训练Llama 3,预计将在今年7月正式发布。业内人士预计,在Llama 3发布并开源后,AI行业将受到很大影响,或将会有非常多GPT4级别的产品涌现。

大模型的未来将如何发展?《科创板日报》记者将持续保持关注。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
跟别人聊天不知道聊什么?适当运用热点话题,再也不怕无话可说..
我们都知道,任何的人际交流,都需要通过话题去实现自己的沟通目的。如果..
这大概是“最烧”感情的聊天方式了,看了真想让他们赶快闭嘴..
关键词:女朋友说和我沟通不来问:我们都是23岁左右,和女朋友都是人力资..
想聊天又不懂得找话题?按照这个方法去聊,你也能做到滔滔不绝..
对于聊天话题,很多人都会觉得这是一个问题。因为他们认为,只有那些让人..
“闲聊”APP涉赌被查,用户:钱已无法取出
记者 | 郑超前12月24日,舟山网警巡查执法在微博上发布案情通报称,今年5..
可以用 Instagram 聊天了,新版引入即时通讯功能
Instagram中的 Direct(类似私信功能)功能一直不太显眼,长久以来,我们..
高情商的5个万能聊天公式,怪不得人缘越来越好,值得收藏..
高情商的人在用的五个万能聊天公式,怪不得人缘越来越好,值得收藏。会聊..
聊天时怎样接话,才能让对方觉得我懂他
​关键词:沟通的深度题主:女​问:冷爱您好,希望你能帮帮我,我26岁,..
高情商的人,喜欢用这4种聊天方式
01所谓情商高,就是会说话。道理显而易见,但是如何说话?很少有人告诉你..
微信“仅聊天”功能上线:戳穿了成年人的社交真相
文 | 夕夕酱· 主播 | 安东尼十点读书签约作者前几天,微信更新了。微信..
关于作者
婆罗花开(普通会员)
文章
862
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40386 企业收录2981 印章生成229790 电子证书1009 电子名片58 自媒体46438

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索