DeepSeek 现在的受欢迎程度是口耳相传的结果。1 月底,开始被积极讨论:首先是硅谷专家,然后是媒体,然后是普通用户。
在 12 月与 1 月期间,DeepSeek 重磅推出了两个全新的开源模型。当下,众人皆对其津津乐道:DeepSeek-V3 于 2024 年 12 月问世。其运作机理与经典的 ChatGPT 如出一辙:能够生成文本并答疑解惑。在测试进程中,该模型的性能远超 Meta* 的 Llama 3.1、OpenAI 的 GPT-4o 以及 Thropic 的 Claude Sonnet 3.5。与此同时,专家们对中国的声明惊愕不已,训练此模型仅耗费两个月以及 550 万美元。相较而言,GPT-4 训练的开销逾 1 亿美元。DeepSeek-R1 于 2025 年 1 月登台亮相。这乃是一个“推理”模型——它已然做好执行繁杂任务的准备,能够构建逻辑链,审慎查验自身的结论,涵盖中间结论,并且能够耗费时间“深思熟虑”。R1 在诸多测试中表现卓越,优于来自 OpenAI 的类似神经网络 o1。同时,ChatGPT 应用程序设有付费模式,而 DeepSeek 则提供了众多免费试用的机会。
两家公司的对比在 IT 社群中引发了一番笑谈。于社交网络中,留意到一条非同寻常的时间线:美国的非营利组织 OpenAI 推出了价值 200 美元的订阅服务,而中国的 DeepSeek 的项目向众人敞开了其开发项目,DeepSeek 实际上并没有从用户那里赚钱。
相关文章
猜你喜欢
成员 网址收录40386 企业收录2981 印章生成229845 电子证书1011 电子名片58 自媒体46658