GPT-4 逐步解释了一个图像笑话。| 图片:OpenAI
在常见的标准测试中,GPT-4 已经优于现有的文本图像模型。OpenAI 表示它仍在挖掘 GPT-4 在图像解决上“新的和令人兴奋的任务”。
为了控制模型,OpenAI 依赖于 API 客户端的系统消息。在某种程度上,这些可用于确定模型响应的特征——即 GPT-4 的响应更多是好莱坞演员的风格还是苏格拉底式的方式。
与此前 GPT 模型类似的限制尽管在推理和多模态方面取得了重大进展,但 GPT-4 与其前身具有相似的局限性。例如,它仍然不完全可靠,容易产生幻觉。然而,在 OpenAI 的内部对抗性真实性评估中,GPT-4 的表现平均比 GPT 3.5 高 40%,平均准确率得分在 70% 到 80% 之间。
GPT-4 幻觉比 GPT 3.5 少,但问题远未解决。| 图片:OpenAI
GPT-4 还继续制造偏见或强化现有偏见——OpenAI 承认,“还有很多工作要做”。在此背景下,该公司指出了最近宣布的可定制 AI 语言模型的计划,这些模型可以反映不同用户的价值观,从而代表更大程度的意见多样性。
OpenAI 显着提高了模型不应回答的查询的安全性,因为它们违反了 OpenAI 的内容政策。与 GPT 3.5 相比,据说 GPT-4 对关键查询的回答减少了 82%。据称,针对敏感查询(例如与医学主题相关的查询)提供符合 OpenAI 政策的答案的可能性要高出 29%。
GPT-4 通过 ChatGPT Plus 启动,API 通过候补名单启动OpenAI 最初将 GPT-4 提供给ChatGPT Plus的付费客户。该服务每月收费 20 美元,可在全球范围内使用。与以前的模型一样,开发人员将通过 API 获得访问权限。当前开发者可以通过等待GPT-4 候补名单加入。
GPT-4 的上下文长度限制在大约 8,000 个token,或大约 25,000 个单词。还有一个版本可以处理多达 32,000 个token,或大约 50 页,但 OpenAI 目前限制访问。
价格为每 1000个提示token 0.03 美元和每 1000个 完成token(8k)0.06 美元,明显高于 ChatGPT 和 GPT 3.5 的价格。最便宜的模型 gpt-3.5-turbo,每 1000 个token的成本仅为 0.002 美元。
当前的 OpenAI 报告没有提供相关架构(包括模型大小)、硬件、训练计算、数据集构建等的更多详细信息。
OpenAI 没有公开参数数量,也可以解释为该公司在其 PR 中不再对参数数量具有决定性的重视,因为仅此一项对模型质量没有意义,但许多人们认为确实如此。
在 GPT-4 演示的准备阶段,社交媒体中提到了一些荒谬的参数数字,以可视化 GPT-4 的性能并助长炒作。在之前的所有模型中,OpenAI 都将模型大小作为一种差异化特征进行传达。
据 OpenAI 称,GPT-4 的首批客户包括语言学习应用程序 Duolingo、计算机视觉应用程序 Be My Eyes,以及使用 GPT-4 组织其内部知识库的摩根士丹利财富管理公司。冰岛政府正在使用 GPT-4 来保护自己的语言。OpenAI 首席执行官 Sam Altman 表示:“我们已经完成了 GPT-4 的初步培训,但我们花了很长时间和大量工作才准备好发布它。”
在 OpenAI 的 GPT-4 披露之后,微软还透露 Bing Chat从一开始就在使用 GPT-4。因此,过去几周与“Sydney”互动过的任何人都可能已经对 GPT-4 的功能有了一些了解。
参考文章:
https://openai.com/research/gpt-4https://the-decoder.com/open-ai-gpt-4-announcement/相关文章
猜你喜欢