作 者丨孔海丽
这场世人瞩目的国际竞赛正趋于白热化。
GPT-4霸占大模型的“王座”已经近一年,距离Mistral拿下“第二名”仅隔一周,新的第一名已经产生。
当地时间3月4日,OpenAI的竞争对手Anthropic,在X上发布了Claude 3最新套系,并且放话:Claude 3在推理、数学、编码、多语言理解和视觉方面建立了新的行业基准。
据Anthropic展示,Claude 3系列在理解能力、数学问题解决能力等方面的得分,几乎全方面碾压GPT-4。
(Claude 3对于诈骗案例的回应 图源:技术报告)
此外,Claude 3的长文本能力依然沿袭了Claude系列的高水准。三个模型都能支持20万token的上下文窗口,在“大海捞针”(分辨集合了不同来源的文档)测试中,Claude 3 Opus表现突出,召回近乎完美。
有实测用户用《红楼梦》电子文档(前二十回)对其进行“插针测试”,Claude 3 Opus用了十几分钟的时间准确找出了用户插入其中的不属于原文的部分,并指出“这些文段和小说并不相关,小说中并没有认真讨论。”
相关文章
猜你喜欢
成员 网址收录40386 企业收录2981 印章生成229692 电子证书1008 电子名片58 自媒体46281