OpenAI紧急直播，ChatGPT疯狂开挂深度研究！10分钟爆肝万字现AGI-脚本导航

> 自媒体 > （AI）人工智能 > OpenAI紧急直播，ChatGPT疯狂开挂深度研究！10分钟爆肝万字现AGI

OpenAI紧急直播，ChatGPT疯狂开挂深度研究！10分钟爆肝万字现AGI

来源：新智元

2025-02-05 15:46:07

171

管理

编辑：Aeneas 桃子

【新智元导读】刚刚，OpenAI再度紧急出手，在发布会直播全新的「Deep Research」功能。基于o3的推理再加上联网搜索，ChatGPT如今可以完成耗费人类专家数小时的复杂研究了！现在，模型已经刷爆「人类最后考试」榜单。

一大早，OpenAI开启的在线直播，简直让人猝不及防。

Mark Chen将之称为「我们的下一代智能体产品」。

去年，OpenAI就推出了o1，但这些推理模型的一个限制，是它们无法使用工具，因为缺少了浏览互联网这个核心能力，

因此，现在OpenAI宣布了一个重大步骤：引入Deep Research！

下面是一个生物学方面的例子。

研究者上传了一篇论文，想找到关于同一主题的其他论文。

最终Deep Research给出的结果，得到了生物学专家的认可。

也就是说，如果你想要的答案非常具体，那么Deep Research就会非常有效。

甚至，我们可以用Deep Research找出10年前在东京去过的餐厅的名字，或者找到我们忘记名字、但记得其中某集内容的电视剧。

除了描述情节之外，其余的信息就是这是5到10年前的电视剧了。

毕竟，OpenAI一直设想，真正的AGI是能够自己产出新颖的科学研究。

几天前的Reddit在线问答中，奥特曼也发表了同样的观点。

要知道这项测试包含了超3,000道「专家级」多选题和简答题，涵盖从语言学到火箭科学、从古典学到生态学等100多个学科。

与o1相比，最大的进步出现在化学、人文社会科学和数学领域。

驱动Deep Research的模型通过在必要时有效寻找专业信息，展现出类人的解决方案。

GAIA

在GAIA测试中，这是一个评估AI解决现实世界问题能力的公开基准测试。

驱动Deep Research的模型同样刷新SOTA，位居外部排行榜榜首。

这些测试包含三个难度等级的问题，成功完成这些任务需要具备推理能力、多模态流畅性、网页浏览和工具使用等多项技能。

专家级任务

另外，在对各个领域专家级任务的内部评估中，Deep Research能够自动化完成，需要多个小时的复杂人工调查工作。

下图为专家级任务与最大工具调用次数的对比，显示出了模型花更多时间思考和浏览时，性能就会更强。

这跟OpenAI的理念相吻合：在未来世界里，智能体将花费越来越长的时间，完成越来越困难的任务。

下面这个案例中，Deep Research进行的化学研究，节省了大约4小时的时间。

局限性

Deep Research仍处于早期阶段，同样存在一些限制。

根据内部评估，它有时会在回答中产生虚构的事实或做出错误的推断，不过，频率明显低于现有的ChatGPT模型。

它可能难以区分权威信息和谣言，目前在置信度校准方面表现较弱，往往无法准确传达不确定性。

在发布时，报告和引用可能存在微小的格式错误，任务可能需要更长时间才能开始。

OpenAI预计所有这些问题都会随着使用时间的增加而快速改善。

Pro用户先上手，Plus一个月内上线

OpenAI称，Deep Research在ChatGPT中非常消耗计算资源。

研究查询所需时间越长，所需的推理计算就越多。

目前，OpenAI开始向Pro用户提供优化版本，每月最多100次查询。

接下来，这项功能会逐渐向Plus和Team用户（带越一个月内），以及Enterprise用户推出。

未来，所有付费用户都将获得更高的使用配额。

届时，OpenAI将发布一个更快、更具成本效益的深度研究版本，它由更小的模型驱动，但仍能提供高质量的结果。

下一步：Operator Deep Research

ChatGPT的Deep Research功能现已在网页版正式上线，并将在一个月内推广到移动端和桌面端。

如前所述，目前，Deep Research可以访问实时互联网，获取最新信息，并对上传的文件进行深入分析。

但，这仅仅是开始。

未来，任何一个人将能够接入更专业的数据源，比如学术期刊或企业内部资源。

这种定制化的知识获取能力，让ChatGPT真正成为你的专属智能助手。

最激动人心的是，OpenAI正在酝酿一场更大的革命。

下一步，通过将Deep Research（负责异步网络调查）与Operator（负责实际行动执行）相结合，ChatGPT将不再局限于信息处理，能够为每个人执行愈加复杂的任务。

这种突破性组合，将开创一个全新的AI个人助手时代。

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

移动、复制或分享ChatGPT对话的指南

人气超ChatGPT的“东方力量”，DeepSeek强在哪？

相关文章

大模型开车哪家强？普渡研究给指南：GPT-4真行啊

白交发自凹非寺量子位 | 公众号 QbitAI现在一句口令，就能指挥汽车了。..

谷歌：GPT-4高阶心智理论彻底击败人类！第6阶推理讽刺暗示全懂了..

编辑：Aeneas 好困【新智元导读】刚刚，谷歌DeepMind、JHU、牛津等发布研..

潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025..

编辑部发自凹非寺量子位 | 公众号 QbitAI奥特曼说，Sora代表了视频生成..

通义千问GPT-4级主力模型降价97%，1块钱200万tokens

5月21日，阿里云方面宣布，通义千问GPT-4级主力模型Qwen-Long，API输入价..

一夜封神！Llama 3.1大模型震撼发布，真正的全民GPT-4时代来了..

Meta更新了许可证，允许开发人员首次使用包括405B参数规模的Llama模型的..

OpenAI的GPT-4，被超了！

作者丨孔海丽这场世人瞩目的国际竞赛正趋于白热化。GPT-4霸占大模型的“..

GPT-4被超越，最强大模型易主？这款大模型竟把人类看穿了！..

每经编辑：黄胜人工智能创业公司 Anthropic 今日宣布推出其突破性的 Clau..

Llama 3来了！4000亿参数狙击GPT-4，训练数据达Llama 2七倍..

▲Llama 3预训练模型数据对比表他们的“红队方法”利用人类专家和自动化..

更强更安全？GPT-4竞争对手来了

近期Claude3超越GPT-4成为“地球最强模型”的消息刷屏了！阿莫迪兄妹。图..

关于作者

司机(普通会员)

文章

901

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

04

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

05

介绍一个能够免费使用国内chatgpt的插件wetab

2023/04/27

标签云

成员 网址收录40386 企业收录2981 印章生成229679 电子证书1008 电子名片58 自媒体46274

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索