OpenAI发布多模态大模型GPT-4：直接开放API，ChatGPT升级-脚本导航

> 自媒体 > （AI）人工智能 > OpenAI发布多模态大模型GPT-4：直接开放API，ChatGPT升级

OpenAI发布多模态大模型GPT-4：直接开放API，ChatGPT升级

来源：澎湃新闻

2023-04-04 09:27:18

581

管理

·GPT-4可以接受图像和文本输入，而GPT-3.5只接受文本；GPT-4在各种专业和学术基准上的表现达到“人类水平”，在事实性、可引导性和可控制方面取得了“史上最佳结果”；当任务的复杂性达到足够的阈值时，GPT-4比GPT-3.5更可靠，更有创造力，能够处理更细微的指令。

·OpenAI承认，GPT-4并不完美，仍然会对事实验证的问题产生错乱感，也会犯一些推理错误，偶尔过度自信。OpenAI将开源OpenAI Evals，用于创建和运行评估GPT-4等模型的基准。

3月14日，ChatGPT的开发机构OpenAI正式发布其里程碑之作GPT-4。

GPT-4是一个多模态大模型（接受图像和文本输入，生成文本）。相比上一代的GPT-3，GPT-4可以更准确地解决难题，具有更广泛的常识和解决问题的能力：更具创造性和协作性；能够处理超过25000个单词的文本，允许长文内容创建、扩展对话以及文档搜索和分析等用例。

此外，GPT-4的高级推理能力超越了ChatGPT。在SAT等绝大多数专业测试以及相关学术基准评测中，GPT-4的分数高于ChatGPT。

OpenAI花了6个月时间使GPT-4更安全、更具一致性。在内部评估中，与GPT-3.5相比，GPT-4对不允许内容做出回应的可能性降低82%，给出事实性回应的可能性高40% 。GPT-4引入了更多人类反馈数据进行训练，不断吸取现实世界使用的经验教训进行改进。

不过，OpenAI表示，GPT-4仍然有许多正在解决的局限性，例如社会偏见、幻觉和对抗性prompt（提示）。

目前，OpenAI在付费版的ChatGPT Plus上提供GPT-4，并为开发人员提供API（应用程序编程接口）以构建应用和服务。值得一提的是，微软的新必应（New Bing）早就用上了GPT-4。

OpenAI还开源了Evals框架，以自动评估AI模型性能，允许用户报告模型中的缺点，帮助其改进。

“GPT-4 是世界第一款高体验，强能力的先进AI系统，我们希望很快把它推向所有人。”OpenAI工程师在介绍视频里说。

OpenAI在官网发布公告，宣布推出GPT-4。
比GPT-3.5更可靠，更有创造力
GPT是Generative Pre-training Transformer（生成式预训练Transformer）的缩写。OpenAI于2018年推出具有1.17亿个参数的GPT-1模型，2019年推出具有15亿个参数的GPT-2，2020年推出有1750亿个参数的GPT-3。ChatGPT是OpenAI对GPT-3模型微调后开发出来的对话机器人。
3月14日，OpenAI在其官网上发布了推出GPT-4的公告。公告称，OpenAI已正式推出GPT-4，这也是OpenAI在扩大深度学习方面的最新里程碑。GPT-4是大型多模态模型，尽管在许多现实世界的场景中能力不如人类，但它可以在各种专业和学术基准上，表现出近似人类水平的性能。
例如：GPT-4通过了模拟的律师考试，分数约为全部应试者的前10%。而相比之下，GPT-3.5的分数大约是后10%。“我们团队花了6个月时间，利用对抗性测试项目以及基于ChatGPT的相关经验，反复对GPT-4进行调整。结果是，GPT-4在事实性（factuality）、可引导性（steerability）和拒绝超范围解答（非合规）问题方面取得了有史以来最好的结果（尽管它还不够完美）。”
OpenAI表示，在过去两年里，他们重构了整个深度学习堆栈，并与Azure（微软云服务）合作，共同设计了一台超级计算机。一年前，OpenAI训练了GPT-3.5，作为整个系统的首次“试运行”。他们发现并修复了一些错误，改进了之前的理论基础。“因此，我们的GPT-4训练、运行（自信地说：至少对我们来说是这样！）空前稳定，成为我们首个训练性能可以进行提前准确预测的大模型。随着我们继续专注于可靠扩展，中级目标是磨出方法，以帮助OpenAI能够持续提前预测未来，并且为未来做好准备，我们认为这一点对安全至关重要。”
OpenAI承认，在简单闲聊时，也许不太好发现GPT-3.5和GPT-4之间的区别。但是，当任务的复杂性达到足够的阈值时，它们的区别就出来了。具体来说，GPT-4比GPT-3.5更可靠，更有创造力，能够处理更细微的指令。
发现图片的可笑之处。
读懂图表并进行分析。
发现图片中的不寻常之处。
阅读文件并总结概要。
读懂网上的梗图。
OpenAI表示，他们一直在努力实现AI的可控制性。与经典ChatGPT的固定语气和风格不同，开发者现在可以通过在系统消息中描述这些方向，来规定自己的AI的风格和任务。系统消息允许API用户在一定范围内大幅对用户体验进行定制。
仍然不是完全可靠的
不过，GPT-4仍然存在与早期GPT模型类似的限制。它仍然不是完全可靠的，比如会对事实产生“幻觉”，并出现推理错误。OpenAI提醒，在使用语言模型的输出时，特别是在高风险的情况下，应该非常小心谨慎。
但相较于以前的模型，GPT-4大大减少了hallucinations（网络错觉）。在内部的对抗性事实性评估中，GPT-4的得分比GPT-3.5高40%。
“该模型在其输出中会有各种偏差，我们在这些方面已经取得了进展，但仍有更多工作要做。根据我们最近的博文，我们的目标是使我们建立的人工智能系统具有合理的默认行为，以反映广泛的用户价值观，允许这些系统在广泛的范围内被定制，并获得公众对这些范围的意见。”公告称。
OpenAI还指出，GPT-4通常缺乏对其绝大部分数据截止后（2021年9月）发生的事件的了解，也不会从其经验中学习。它有时会犯一些简单的推理错误，或者过于轻信用户明显的虚假陈述。有时它也会像人类一样在困难的问题上失败，例如在它产生的代码中引入安全漏洞。GPT-4也可能在预测中自信地犯错。
GPT-4与过去的模型会存在类似风险，如产生有害的建议、错误代码或不准确信息。然而，GPT-4的额外能力还导致了新的风险面。“为了明确这些风险的具体情况，我们聘请了50多位来自人工智能对接风险、网络安全、生物风险、信任和安全以及国际安全等领域的专家对该模型进行对抗性测试。”OpenAI表示，这些领域专家的反馈和数据为缓解和改进模型提供了依据，比如他们已经收集了额外的数据，以提高GPT-4拒绝有关如何合成危险化学品的请求的能力。
此外，GPT-4在人类反馈的强化学习（RLHF）训练中加入了一个额外的安全奖励信号，通过训练模型来拒绝对此类内容的请求，从而减少有害产出。
与GPT-3.5相比，这些缓解措施大大改善了GPT-4的许多安全性能。与GPT-3.5相比，OpenAI将模型对非法内容请求的响应倾向降低了82%，而GPT-4对敏感请求（如医疗建议和自我伤害）的响应符合OpenAI政策的频率提高了29%。
OpenAI强调，总的来说，模型级干预措施增加了诱发不良行为的难度，但仍然存在“越狱”的情况，以产生违反使用指南的内容。
付费用户将获得有使用上限的GPT-4权限
和之前的GPT模型一样，GPT-4基础模型的训练是为了预测文档中的下一个单词，并使用公开的数据（如互联网数据）以及OpenAI授权的数据进行训练。这些数据来自于极大规模的语料库，包括数学问题的正确和错误的解决方案，弱的和强的推理，自相矛盾的和一致的声明，以及种类繁多的意识形态和想法。因此，当被提示有一个问题时，基础模型可以以各种各样的方式作出反应，而这些反应可能与用户的意图相去甚远。为了使其与用户的意图保持一致，OpenAI使用人类反馈的强化学习对模型的行为进行微调。
OpenAI正在开源其软件框架OpenAI Evals，用于创建和运行评估GPT-4等模型的基准，同时逐个样本检查其性能。用户可以应用它来跟踪不同模型版本（将定期推出）和不断发展的产品集成的性能。“我们邀请大家使用Evals来测试我们的模型，并提交最有趣的例子。”
ChatGPT Plus用户将获得有使用上限的GPT-4权限。OpenAI将根据实际需求和系统性能调整确切的使用上限，但预计容量将受到严重限制。
OpenAI还可能为更高的GPT-4使用量引入一个新的订阅级别，也希望在某个时候提供一定数量的免费GPT-4查询，使没有订阅的用户也可以尝试。
要获得GPT-4的API，需要去OpenAI的官方等待名单上注册。获得访问权限后，用户目前可以向GPT-4模型发出纯文本请求（图像输入仍处于有限的测试阶段）。定价为每1k个prompt token 0.03美元，每1k个completion token 0.06美元。

第1节、 OpenAI发布多模态大模型GPT-4：直接开放API，ChatGPT升级(第1节) 收藏免费

1、 OpenAI发布多模态大模型GPT-4：直接开放API，ChatGPT升级(第1节) 免费

0

点赞

赏礼

赏钱

0

收藏

Ctrl+回车,可快速发表内容!截图提示：按住“Ctrl、Alt、A”这三个键，点击“完成”后，在此输入框Ctr+V粘贴即可实现截图上传

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

36氪专访 | 百炼智能总裁姚从磊：实践出真知，ChatGPT让B2B营销更智能

2023-04-04 09:28

“封神”的 ChatGPT 被曝 Bug：“小心，你的聊天记录会被其他用户看到！”

2023-04-04 09:25

相关文章

ChatGPT概念股不香了？这些公司成机构新目标

3月以来，随着数字经济在A股市场攀升势头不减，不少公司获高毅、源乐晟、..

高菲、王晴川 | 人工智能聊天机器人ChatGPT的媒介属性、影响与局限..

【摘要】人工智能聊天机器人ChatGPT的横空出世给千职百业赋予了巨大的能..

这种群，千万别进！

为了增加自己账号的粉丝数量有人利用公众“吃瓜”的心理编造虚假信息误导..

「ChatGPT 焦虑症」在蔓延，我最怕的不是被 AI 取代

AI 还不够完美，也依然会胡说八道，但很多时候完成比完美更重要，它在完..

\u0026#34;聊天机器人大比拼：ChatGPT、通义千问和文言一心谁更胜一筹？\u0..

在当前的人工智能领域，聊天机器人技术的发展正变得越来越成熟。目前市场..

最近很火的问答ChatGPT机器人是什么？

ChatGPT，由美国OpenAI公司研发，开发的核心宗旨是“实现安全的通用人工..

专访耶鲁副教务长：我们从未想过完全禁止ChatGPT

对许多人来说，9 月标志着一年（学年）的开始：无需再多的庆祝和立誓，背..

AI出现无法解释的推理能力！科学家：暂停！

很多人担忧，人工智能可能是未来人类文明最大的风险之一。其威胁程度远超..

风向变了？ChatGPT传来3个消息，不到一个月“天才”变“混蛋”？..

ChatGPT横空出世，成为了2023年科技圈最热的话题。就连比尔盖茨也用“跟..

关于作者

杨子(普通会员)

文章

588

关注

0

粉丝

0

点击领取今天的签到奖励!

今日签到

昨天签到

前天签到

签到排行

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复
2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！
2023/07/15

03

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！
2023/07/18

04

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁
2023/06/19

05

OpenAI突发更新！GPT-3.5正式开放微调，人人可打造专属ChatGPT
2023/08/26

标签云

玻璃纤维知识百科

永铭国际投资移民公司

指帮连锁

深圳市航速成国际物流设计有限公司

奥凯水晶网

法律桥

766培训网

佛山市第二人民医院

上海野生动物园

四川东柳醪糟有限责任公司

深圳灵思纵横信息科技有限公司

北京北极环影科技有限公司

广东喜之郎集团有限公司

思达派

上海彩集网络科技有限公司

广州米兰新娘婚纱摄影

北京社科赛斯教育科技有限公司

书旗小说

陕西索维电气有限公司

安徽省赛宇刷业有限公司

范小错

河北医科大学第三医院

湖南恒润高科股份有限公司

汇学网

公务员考试网