> 自媒体 > (AI)人工智能 > 热点关注丨微软154页研究论文刷屏,对GPT-4最全测试曝光
热点关注丨微软154页研究论文刷屏,对GPT-4最全测试曝光
来源:中国人工智能学会
2023-04-18 15:57:26
409
管理

转自 AI科技大本营

整理 | 苏宓出品 | CSDN(ID:CSDNnews)

​2019 年,微软用 10 亿美元砸进 OpenAI,两者展开为期数年的合作。当时两家对外公开的合作内容包括,微软和 OpenAI 将联合开发新的 Azure AI 超级计算技术,而 OpenAI 也将把它的服务转移到 Azure 上运行,最终目标是向通用人工智能(Artificial General Intelligence,AGI)技术发起进攻。简单总结,微软与 OpenAI 联手,也被外界解读为,明为 AGI 研究,暗争 Google 市场。几年之后,当 OpenAI 带着 ChatGPT、GPT-4 王者归来,微软率先利用这些技术加码新 Bing、Office 全家桶、Azure 等业务、产品之时,毋庸置疑,其进度早已超越了 Google 还在加快融入 Bard 大模型的整体步伐。​那么在明面上,AGI 的进度到底走到了哪里?​近日,微软研究团队用 154 页的论文报告内容给出了解答——GPT-4 语言模型可以被视为 AGI 的早期版本!

​同时,随着时间的推移,GPT-4 也在以难以想象的速度不断扩充自己的能力。如下图所示是一个月期间,研究人员用相同的提示词让 GPT-4 生成的绘图。

研究人员发现,GPT-4 似乎能够理解和连接任何主题,并且能够执行任务,这超出了狭义人工智能系统的典型范围。为了验证 GPT-4 在 AGI 上所具备的能力,研究人员提出了一种不同的方法来研究 GPT-4,它更接近于传统的心理学而不是机器学习,利用人类的创造力和好奇心。因此,以上图为例,当研究人员把独角兽角部分的代码认为删除之后,用自然语言让 GPT-4 生成时,它也能做到“看”(此时测试的 GPT-4 版本不是多模态的)的能力:自动在合适位置加上角。这表明 GPT-4 它可以根据自然语言描述来理解和操作代码,以及推断和生成视觉特征。

​另外,微软研究团队基于人类的创造力和好奇心来产生新颖和困难的问题,并探测 GPT-4 的反应和行为,也选择从 1994 年国际共识智力定义中的所给出不同能力进行验证,包括推理、计划、解决问题、抽象思考、理解复杂的想法、快速学习和从经验中学习的能力。

​翻译GPT-4 的主要优势是它对自然语言无与伦比地掌握。它不仅可以生成生成流畅和连贯的文本,而且还能以各种方式理解和处理它,如总结、翻译或回答极其复杂的问题。此外,这里提到的翻译我们所说的翻译不仅是指不同自然语言之间的翻译,还包括语气和风格的翻译,以及跨领的翻译,如医学、法律、会计、计算机编程、音乐等等。如假设是柏拉图批判自回归语言模型:​

​还能逆向工程:​

​在测试时,因为研究人员拿到 GPT-4 模型比较早,当时并不具备多模态能力,即使是现在的 GPT-4 也不具备生成图像等能力。不过倒是可以使用 SVG(可扩展矢量图形)生成一些图像:​

​还能结合字母和物体:​

​GPT-4 可以从提示中生成代码,这些代码可以被呈现为图像,再与现有的图像合成模型相结合,就有可能为应用开发的草图带来无限的可能:​

​值得注意的是,GPT-4 模型的数据也包含了以ABC符号编码的音乐信息,所以它也能生成图谱:​

​与世界交互的能力

​智能的一个关键方面是互动性。不过 GPT-4 对当前最新的知识和符号识别是存在一定的局限性的:​

​整体而言,研究小组发现,GPT-4 在其上一代产品所缺乏的一系列类别中达到了接近人类水平的性能。根据该论文,GPT-4 在几次考试中也表现得非常好,在律师考试、LSAT 和注册侍酒师理论测试中的得分分别为 90 分、88 分和 86 分。

GPT-4 距离理想中的 AGI 还有多远?

​那么,在 GPT-4 实现种种能力的基础上,是否就意味着 AGI 时代的到来。其实不然,研究人员目前尚未就 AGI 或智能的定义达成一致。然而,一般来说,大家都会同意,当一个人工智能系统有意识并像人类一样思考时,就已经达到了 AGI。虽然 GPT-4 在一些任务中的表现优于人类,但值得注意的是,人工智能并没有像人类那样克服这些障碍。​这也正如研究人员在论文中写道,“我们声称 GPT-4 代表了 AGI 的进步,但这并不意味着它在做什么方面是完美的,或者它接近于能够做人类能做的任何事情(这是 AGI 的通常定义之一),或者它有内在的动机和目标。”研究人员指出,虽然 GPT-4 "在许多任务上达到或超过了人类水平",但它的整体 "智能模式明显不像人类",其希望这一次的探索提供了一个欣赏 GPT-4 的非凡能力和挑战的第一步,也希望 GPT-4 为开发更正式和全面的方法来测试和分析具有如此广泛智能的未来人工智能系统开辟了新的机会。「我们工作的核心主张是,GPT-4 达到了一种通用智能的形式,确实擦出了 AGI 的火花。这表现在它的核心心智能力(如推理、创造力和推理),它获得专业知识的主题范围(如文学、医学和编码),以及它能够完成的各种任务(如玩游戏、使用工具、解释自己,......)」研究人员说道,不过,要创建一个可以被称为完整的 AGI 的系统,还有很多事情要做。最后,这篇论文对于 GPT-4 各种基准测试还是值得一看,从中也能挖掘出 GPT-4 更多的潜力。

​完整论文内容可查看:https://arxiv.org/pdf/2303.12712.pdf

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
横道不笑(普通会员)
文章
345
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成187037 电子证书796 电子名片49 自媒体20954

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索