Mistral AI新旗舰模型挑战Llama 3.1！1230亿参数性能直逼GPT-4o-脚本导航

> 自媒体 > （AI）人工智能 > Mistral AI新旗舰模型挑战Llama 3.1！1230亿参数性能直逼GPT-4o

Mistral AI新旗舰模型挑战Llama 3.1！1230亿参数性能直逼GPT-4o

来源：智东西

2025-02-06 15:55:56

238

管理

▲代码生成基准测试中Mistral Large 2与其他模型的性能和准确率对比

▲Mistral Large 2与其他模型在GSM8K（8-shot）和MATH（0-shot，no CoT）生成基准测试中的性能和准确率对比

在推理能力训练方面，Mistral Large 2的训练重点之一还在于尽量降低模型产生“幻觉”的概率。“幻觉”是AI系统，尤其是生成模型（如大语言模型）在生成内容时出现的虚假、错误或不准确的信息。经过微调后，Mistral Large 2在响应时更加谨慎和敏锐，确保提供的信息是可靠、准确的。

Mistral AI称，经过训练后，该模型能在自己无法找到解决方案，或没有足够自信能提供准确答案时，会承认无法回答该问题，而不是继续编造答案。

此外，Mistral AI还大幅改进了Mistral Large 2的指令遵循和对话能力。该模型在遵循精确指令和处理长时间多轮对话方面表现尤为出色。

▲Mistral Large 2与其他模型在通用对齐基准测试中的性能对比

同时，Mistral Large 2在生成答案时尽量保持简洁明了，以加快交互速度，增加该模型的成本效益。

▲Mistral Large 2与其他模型生成回答的平均长度对比

目前，Mistral Large 2可通过Mistral平台（la Plateforme）访问，在Mistral研究许可下，该模型可供非商业使用。商业应用需要Mistral的商业许可。此外，用户可以在le Chat上测试该模型，亲身体验其功能。

结语：在高性能和成本效益间找到平衡

AI模型研发正以前所未有的速度推进，全球科技巨头以及新兴初创公司之间竞争激烈，模型研发方向已不是一味地追求神经网络的规模，Mistral Large 2的发布预示着一个潜在的趋势，即AI模型要在高性能和成本效益间找到平衡。

Mistral AI表示，Mistral Large 2是其在成本效益、生成速度和性能上的新尝试。在参数量1230亿的情况下，性能能接近4050亿的Llama 3.1 405B，同时能快速提供简洁、准确的回答。几天前，三个小模型（Mistral Nemo、GPT-4omini、SmolLM）的陆续发布也表示，并不是参数量越大就越好。将来，我们期待更多更具成本效益的模型出现，提高AI生成模型生态的多元化。

来源：Mistral AI

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

Llama3微调教程：超简单，人人都可以打造属于自己的GPT！

2个月前

Streamlit + GPT-3: 打造个人AI助手的全过程

2个月前