【CSDN 编者按】OpenAI 总裁格雷格・布罗克曼:GPT-4 并不完美但绝对与众不同。
原文链接:https://TechCrunch.com/2023/03/15/interview-with-openais-greg-brockman-gpt-4-isnt-perfect-but-neither-are-you/未经允许,禁止转载!
整理 | 王子彧
出品 | CSDN(ID:CSDNnews)
3月15日,继 ChatGPT 展现了惊人的实力之后,OpenAI 又扔下了一颗核弹:备受期待的史上最强人工智能大模型 GPT-4 发布了。
据 TechCrunch 消息,OpenAI 联合创始人兼总裁格雷格・布罗克曼在接受记者凯尔·威格斯采访时表示,GPT-4 并不完美但绝对与众不同,并且他还在采访中透露,OpenAI 正在测试 GPT-4 高级版本,是普通 GPT-4 储存内容能力的 5 倍。本文对这篇采访进行了编译,以飨读者。
关键改进:多模态能力
GPT-4 在其前身 GPT-3 的基础上,对很多方面做了关键性的改进。例如提供了更多真实的声明,并允许开发者更容易设计其风格和行为。同时,GPT-4 也是多模态的,它可以可以接受图像作为输入并生成标题、分类和分析。
但 GPT-4 也有局限性。和 GPT-3 一样,该模型对事实产生了 "幻觉",并出现了基本的推理错误。OpenAI 在自己的博客上举了个例子, GPT-4 将“猫王”埃尔维斯・普雷斯利(Elvis Presley)描述为 "一个演员的儿子",但事实是他的父母都不是演员。
当被问及如何比较 GPT-4 和 GPT-3 时,格雷格・布罗克曼说了一个词:与众不同。他解释到:“尽管 GPT-4 还存在很多问题和错误,但绝对与众不同,你可以看到其在微积分或法律等技能方面的提升。虽然它曾在某些领域表现很糟糕,但现在已经达到超越常人的水准。”
测试结果验证了格雷格・布罗克曼的观点。在高考微积分考试中,GPT-4 得了 4 分, GPT-3 得了 1 分,而介于 GPT-3 和 GPT-4 之间的中间模型 GPT-3.5,得了 4 分。
在分析 GPT-4 的能力时,OpenAI 还让该模型参加了统一律师考试、法学院入学考试(LSAT)、研究生入学考试(GRE)的定量、口头推理、分析写作考试以及和各种 AP 科目考试等测试。结果显示,GPT-4 在大多数这些专业和学术考试中表现与人类水平相当。这意味着,如果 GPT-4 是一个仅凭应试能力来判断的人,它可以进入法学院,而且很可能也能进入许多大学。
不仅如此,GPT-4 更受人关注的是上面提到的多模态。GPT-3 和 GPT-3.5 只能接受文本提示(例如 "写一篇关于长颈鹿的文章"),而 GPT-4 可以同时接受图片和文本的提示来完成一些动作(例如识别在塞伦盖蒂拍摄的长颈鹿图像,并给出基本的内容描述。)
这是因为 GPT-4 是在图像和文本数据上训练的,而它的前身只在文本上训练。OpenAI 说,训练数据来自 "各种合法授权的、公开可用的数据源,其中可能包括公开可用的个人信息",但当被问具体细节时,格雷格・布罗克曼避而不谈。(训练数据曾使 OpenAI 陷入法律纠纷)。
关于未来:GPT-4 的另一个版本布罗克曼的谈话还谈到了 GPT-4 的上下文窗口,指的是模型在生成其他文本之前可以考虑的文本。OpenAI 正在测试 GPT-4 的另一个版本,它可以 "记住 "大约 50 页的内容,是普通的 GPT-4 所能容纳内容的 5 倍,是 GPT-3 的八倍。
布罗克曼认为,扩大的上下文窗口会带来新的、以前没有探索过的应用,特别是在企业中。他设想了一个为公司打造的 AI 聊天机器人,利用来自不同来源的各部门的员工的背景和知识,以一种非常明智但具有对话性的方式回答问题。
这不是一个新概念。但布罗克曼提出的理由是,GPT-4 的答案将比今天的聊天机器人和搜索引擎的答案有用得多。他说:“以前,模型根本不知道你是谁,你对什么感兴趣等。而有了更大的上下文窗口肯定会让它的能力变强,从而更好的为人们提供服务支持。”
相关文章
猜你喜欢