白交 西风 发自 凹非寺
量子位 | 公众号 QbitAI
Anthropic刚刚官宣:Claude 3来了!
作为OpenAI最强竞争选手,此次它发布的新模型家族,以最强版Claude 3 Opus为代表,“已经实现了接近人类的理解能力”——
在推理、数学、编码、多语言理解和视觉方面,全面超越GPT-4在内的所有大模型,直接重新树立行业基准的那种。
浅看一下这份成绩单,就十分扎眼~
目前可以免费体验第二强Sonnet,Opus最强版供Claude Pro付费用户使用,但大模型竞技场也可以白嫖。于是乎,网友们已经开始疯玩上了。(Doge)
另外,Opus和Sonnet也开放API访问,开发者可以立即使用。
有人直接艾特奥特曼:好了,你现在可以发布GPT-5了。
另外,在拒绝回答人类问题方面,Claude 3也前进了一大步,拒绝回答的可能性显著降低
还在生物知识、网络相关知识等方面取得了进步,但出于负责任的考虑,仍处于AI安全级别2(ASL-2)。
其次,在响应时间上,Claude 3大幅缩短,做到近乎实时。
官方介绍,即将发布的小杯Haiku能够在三秒内阅读并理解带有图表的长度约10k token的arXiv论文。
而中杯Sonnet能够在智能水平更高的基础上,速度比Claude 2和Claude 2.1快2倍,尤其擅长知识检索或自动化销售等需快速响应的任务。
大杯Opus的智能水平最高,但速度不减,与Claude 2和Claude 2.1近似。
官方对三款型号的模型也有清晰的定位。
大杯Opus:比别家模型更智能。适用于复杂的任务自动化、研发和制定策略;中杯Sonnet:比其他同类模型更实惠。更适合规模化。适用于数据处理、RAG、在中等复杂度工作流程中节省时间;小杯Haiku:比同类模型更快速、实惠。适用于与用户实时互动,以及在简单工作流程中节省成本;在价格方面,最便宜的小杯定价0.25美元/1M tokens输入,最贵的大杯定价75美元/1M tokens输入
不过,网友们也已经po出了一些测试效果,比如让Sonnet解谜题。
为其提供一些示例,要求它找出数字之间的关系,比如“1 Dimitris 2 Q 3”,意思是3是1和2相加的结果。
结果Sonnet成功解出-1.1加8等于6.9,所以“X”的值应该是6.9:
还有网友发现Sonnet现在也可以读取 ASCII 码了,直呼:这是GPT-4 的水平了。
在编程任务上,谁写的代码好先不说,Claude 3至少不会像GPT-4一样偷懒。
还有体验到了Opus的玩家,在线给模型挖坑,可opus硬是完美躲避不上当:
初看这效果,感觉还行。这时候应该艾特OpenAI:GPT-5在哪里?
好了,感兴趣的朋友,可以戳下方链接体验啦~https://claude.ai/参考链接:[1]https://www.anthropic.com/news/claude-3-family[2]https://twitter.com/AnthropicAI/status/1764653830468428150/photo/1
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章
猜你喜欢
成员 网址收录40386 企业收录2981 印章生成229695 电子证书1008 电子名片58 自媒体46281