> 自媒体 > (AI)人工智能 > 被扫地出门18个月后,马斯克终复仇OpenAI
被扫地出门18个月后,马斯克终复仇OpenAI
来源:人人都是产品经理
2025-03-21 12:48:41
87
管理

18个月前,马斯克被OpenAI扫地出门;18个月后,他带着Grok 3强势回归,直接将OpenAI拉下神坛。

昨天,马斯克发布的Grok 3大模型不仅在性能上超越了OpenAI的GPT-4o,还在推理、编程和多模态能力上展现出惊人的实力。

从被踢出OpenAI到创建xAI实验室,再到如今的复仇成功,马斯克用“暴力开源”策略撕裂了OpenAI的闭源壁垒。而OpenAI的山姆·奥特曼也毫不示弱,声称GPT-4.5将带来AGI的初体验。

这场AI领域的权力天平正在倾斜,而开源与闭源的路线之争,或许才是这场战争的真正焦点。

2月18日,马斯克发布完Grok 3大模型后,转发了一条推特:

划重点,Grok3目前世界第一强模型(竞技场得分1400),比OpenAI的推理模型还厉害,18个月就超越了山姆·奥特曼领导下的OpenAI。

要知道马斯克曾是OpenAI的天使投资人,甚至Open这个关键词就是马斯克帮取名的。变化发生在2018年,奥特曼与马斯克在“开源还是闭源”的问题上彻底决裂。马斯克坚信,人工智能必须透明开放以规避风险;而奥特曼则在资本压力下选择与微软结盟,将技术封闭于商业护城河内。

此前大家都相安无事,因为当时ChatGPT还没那么厉害。就在2022年末,ChatGPT4横空出世后,马斯克对于被踢出了这么一个跨时代项目,就开始碎碎念了。应了那句话:『不怕分手,就怕前任过得好。』

这段往事在2024年再度被点燃。马斯克以“违背公益初衷”为由,对OpenAI发起诉讼,指控其将技术垄断权拱手让给微软。这场官司虽未胜诉,却为马斯克埋下了一颗复仇的种子——2023年7月,马斯克成立xAI实验室,开始发布Grok系列模型,对标OpenAI的GPT系列模型。

01 大力出奇迹,18个月追上OpenAI

在Grok3发布会上,开场xAI介绍了他们的决心:

『122天,建成了10万显卡集群,再过了92天后,建成了20万张 H100 显卡集群。』这是世界上最大的H100算力集群。

很多朋友不懂这个数据的意义,这意味着Grok3训练算力超过了DeepSeek V3的263倍,却只带来超过DeepSeek 33%的Benchmark能力。

Scaling Law是否失效暂且不提,就说这大手笔投入算力基础设施,也算是体现了马斯克追赶的决心。

短短2年内,xAI接连推出Grok系列模型:从参数量为3140亿的Grok-1,到支持多模态的Grok-1.5 Vision,追赶ChatGPT 4o的Grok 2,以及今天登顶的Grok 3,Grok每一步都试图用“暴力开源”策略撕裂OpenAI的闭源壁垒。

重要时间节点是在2024年底。xAI在田纳西州孟菲斯建成了一座堪比“算力核电站”的数据中心,10万块英伟达H100 GPU组成的集群,让Grok 3的训练速度比前代提升十倍。马斯克在推特上写道:“算力即权力,而我们将拥有最暴力的武器。”

此后马斯克宣布融资60亿美元,继续投资Grok大模型的训练。这笔钱比国内大模型六小虎的融资总额还多。

在xAI成立的18个月(不到2年时间)后,Grok 3正式发布,成功登顶最强大模型。

02 Grok 3的“量子跃升”,有何杀手锏?

2025年2月18日,全球百万观众涌入直播平台,见证马斯克的最新大模型,此前他在中东的AI大会上,宣布将发布全球最聪明的大模型Grok 3。现在看来Grok 3名副其实,具有诸多强悍能力。

技术核爆点一:最聪明的模型

基准测试数据显示,Grok 3达到了1400的Elo得分,这是其他任何模型都未曾达到的。

Grok 3在AIME 2025科学推理测试中得分超过Gemini 2 Pro和GPT-4o,其迷你版模型甚至在编程任务中击败了DeepSeek-R1。

可能大家已经被大模型刷榜测试的传闻,搞得不太相信这些数据的真实性。国外有拿到Grok 3测试的大神,测试了超过人类和一些大模型理解的《卡坦岛》问题:。

“创建一个显示六边形网格的棋盘游戏网页,就像游戏中的 Settlers of Catan 一样。每个六边形网格的编号从 1 到 N,其中 N 是六边形瓷砖的总数。使其通用,以便可以使用滑块更改“环”的数量。例如,在 Catan 中半径为 3 个六边形。请使用单个 html 页面。”

他评价很少有模型能够可靠地做到这一点。顶级的 OpenAI 思维模型(例如 o1-pro,每月 200 美元)也能做到这一点,但 DeepSeek-R1、Gemini 2.0 Flash Thinking 和 Claude 都没有做到这一点。

甚至数学历史上著名的未接知名『黎曼猜想』,Grok 3也会尝试去算,不像O1-Pro、Claude等模型直接回答做不了,放弃了。

技术核爆点二:动态反思机制

Grok 3引入“思维链”推理技术,能像人类一样拆解复杂任务并实时修正逻辑断层。现场演示中,Grok 3仅用30秒便生成了一份从地球到火星的航天器轨迹图,并标注出引力弹弓效应的最佳利用节点。

『你能看到Grok真的在做一些模糊思考,这样模型就不会被立即完全复制。』

图中可以看到,在数学测试中,Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分,超越了o3mini的87分、o1的83分和DeepSeek-R1的80分。

同样在科学和编程两项中,Grok3两款模型也存在一定程度上的领先。

技术核爆点三:更多呈现模式

Grok 3不仅能解锁测试时间计算,还能启用强大的代理。这些能力促成了一款名为DeepSearch的新产品。“下一代搜索代理,用于理解宇宙”。DeepSearch还会展示它进行搜索时所采取的步骤。

不仅如此,Elon强调了Grok 3的创意涌现能力。在这个和DeepSeek十分相似的页面上,Grok新增了第三个标签按钮『Big Brain』。使用“大脑模式”,通过更多计算资源和推理来使用Grok 3,也许会呈现意想不到的效果。

未来Grok 3应该不太限制大模型的创作风格,以及思考创意的边界。相比之下,OpenAI则是解除了ChatGPT的成人内容限制,这就。。。。。

03 口水战打不完,奥特曼的反击

面对Grok 3的突袭,OpenAI并非毫无动作。

发布会前天,山姆·奥特曼在X平台宣称:“GPT-4.5将带来AGI的初体验。”预计GPT-4.5也会在一两周内发布,届时拿出满血的O3,应该能夺回全球最佳模型的宝座。

此前,一个由马斯克牵头的财团拟出价 974 亿美元收购 OpenAI,后者的首席执行官萨姆・阿尔特曼对此回应称,” 不用了,谢谢,但如果你愿意,我们可以以 97.4 亿美元的价格收购推特(即如今的 X)”后。

商业竞争互相都不手软,口水战也打个不停。

未来两家公司还存在路线竞争。与OpenAI的闭源策略针锋相对,Grok 3承诺未来“开源”,Grok 2将在一个月内开源,并计划接入特斯拉车载系统和Optimus人形机器人。

同时,xAI同步推出了“Super Grok”订阅服务,以每月49美元的价格向开发者开放深度搜索(DeepSearch)功能——这种能交叉验证信息来源、公开推理路径的引擎,直指ChatGPT的“黑箱”痛点。

更深层的冲击来自生态层面。Grok 3的开源策略吸引了大量开发者涌入,而特斯拉的硬件布局(如Model Q车载系统)则为AI落地提供了现实场景。

2025年,AI领域的权力天平正在倾斜。Grok 3的颠覆性不仅在于技术,更在于它重新点燃了“开源理想主义”的火种。正如一位硅谷投资人所言:“马斯克用Grok 3完成了一场迟到的复仇,但这场战争的真正赢家,或许是那些终于看见技术透明曙光的人们。”

山姆·奥特曼会拿出怎样的竞争手段回击呢?

作者丨鲸哥

本文由人人都是产品经理作者【AI鲸选社】,微信公众号:【鲸选AI】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
OpenAI 发布 o1-pro API,重新定义 AI 模型的“奢侈品”价格..
当你在科技领域听到“价格突破天际”时,或许已经见怪不怪。但当 OpenAI ..
李开复:像 DeepSeek 这样的开源模型让OpenAI 的 Sam Altman 彻夜难眠..
OpenAI 曾引领人工智能革命,目前仍是最有价值的人工智能初创公司,但一..
百万Token烧600刀!OpenAI O1-Pro性能翻倍,普通程序员只能围观?..
OpenAI最新发布的O1-Pro推理模型以每百万Token 600美元的天价引发热议!..
百度回应「开盒」事件:信息并非来自百度;OpenAI 推出目前最昂贵的人工智..
过去,这位前英特尔负责人认为英伟达能够占据市场领先地位是「极其幸运的..
OpenAI 发布全新音频模型,AI 助手听起来比以往更像真人!..
OpenAI 刚刚发布了一套全新的音频模型,专为打造更自然、更灵敏的语音助..
OpenAI 发布了新的 AI 模型,但价格高得惊人
OpenAI 发布了其最新模型 o1-pro,这是其推理模型 o1 的更新版本——但价..
中文觉醒进行时:当ChatGPT开始用汉字思考,英语霸权还剩几时?..
汉字的传承,并非一帆风顺,在几千年中也曾经受过波折。当年清政府闭关锁..
“对方正在输入……”会让你想什么
你刚刚在微信上跟领导进行了一场亲(礼)切(貌)友(尴)好(尬)的对话..
聊天带点不正经,学会调戏才更爱
01不能再想你了,因为一想到你,成年人该有的想法都溢出来了。02偷偷告诉..
关于作者
我是歌王(普通会员)
文章
878
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40395 企业收录2981 印章生成235865 电子证书1039 电子名片60 自媒体47129

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索