> 自媒体 > (AI)人工智能 > GPT-4来了!考试碾压人类90%“做题家”,会认梗图,还会角色扮演
GPT-4来了!考试碾压人类90%“做题家”,会认梗图,还会角色扮演
来源:红星新闻
2023-04-27 15:05:49
543
管理

美国当地时间3月14日,OpenAI官网发布了GPT-4,一石激起千层浪。

比起此前上亿人争相试用的ChatGPT(依靠GPT-3.5模型),GPT-4在日常对话表现中并没有太大革新性的进步。但作为一个“多模态”模型,GPT-4不仅适用更多语种,而且在语言文本之外新增了强大的识图功能。

在对话中,GPT-4比ChatGPT更有创造性和推理能力,不仅可以创作诗歌、帮你安排工作日程,还在模拟的标准化考试中碾压绝大多数人类考生。令人“细思极恐”的是,和以前人们印象中“不近人情”的AI相比,GPT-4在图片和文字领域都更“善解人意”,甚至能扮演不同的人格和用户对话。

也许在并不遥远的未来,一个考试中碾压人类“做题家”、模仿“霸道总裁”口吻和员工对话,并能精准解读表情包背后小情绪的强大AI即将诞生。至于这对人类来讲是福是祸,也许就是个见仁见智的问题了。

会创作诗词,还能押上韵

ChatGPT的记忆长度大约是8000个单词,折合四到五页书。GPT-4的最大记忆约6.4万个单词,折合近50页文字,因此对话具有更强的准确度和上下连贯性。

与ChatGPT,GPT-4在文本对话中最大的进步在于具备了一定的文学创作能力,能根据要求创造出不同文风的歌词、诗篇甚至短句。更夸张的是,它甚至能押上韵脚。OpenAI官网展示了一段另类押韵的炫技文本。

根据指令,GPT-4用26个单词写成一句话概括“灰姑娘”的童话故事。令人震撼的是,这26个单词的首字母恰好是从A到Z的排序。

可识别图片,还能get到搞笑的梗

和单纯文本对话的ChatGPT相比,GPT-4最突出的地方在于可以接受图片输入,它会处理这些图像以查找相关信息。GPT-4不仅能简单识别图片要素并进行描述,甚至具备读懂梗图的能力。

OpenAI提供了一个经典示例,输入一张超大的图片,模型能解读出这张图片搞笑的点在哪里:

图片显示了一个“Lightning Cable”适配器的包装,总共包含三个部分。

图1:一部智能手机,其充电端口插着一个VGA接口(大的蓝色15针接口,通常用于电脑显示器)。

图2:“Lightning Cable”适配器的包装上有一张VGA接口的图片。

图3:VGA连接器的特写,末端是一个小的Lightning连接器(用于为iPhone和其他苹果设备充电)。

这张图片的笑点来自将一个巨大、过时的VGA连接器插入一个小体积、现代的智能手机充电端口的荒谬性。

此外,GPT-4还和为视力障碍者服务的公益项目Be My Eyes合作。AI模型可以为盲人或视弱群体描述了裙子上的图案,帮助识别植物,解释如何使用健身房的某台机器。

会推理判断,考试能力超过“做题家”

OpenAI用上面这张图片演示了GPT-4的推理和识图能力。当模型收到这张在厨房里拍的照片后,它不仅能辨认出面粉、鸡蛋等元素,还可以迅速给出食谱建议。

由于有着强大的推理能力,在标准化的技能测试中,GPT-4比起ChatGPT的表现有了实质性的提升。OpenAI官网称,在模拟美国律师从业资格考试中,ChatGPT的成绩在全体考生中只能排到末尾10%,而GPT-4能排进前10%。在难度更高的国际生物学奥赛中,GPT-4甚至能吊打99%的人类选手。

在“美国高考”SAT中,GPT-4在数学和阅读部分也能战胜近90%的考生。

会“角色扮演”不同人格

在情商方面,GPT-4比起GPT-3.5也提高很多。根据OpenAI的描述,用户能够将ChatGPT原本固定冗长的语气和风格,改为更适合他们需要的个性化风格。

具体来说,用户可以要求模型假扮各种角色,比如电视台进行采访的主持人、面对老年用户的基金经理等。根据案例展示,GPT-4可以熟练切换语言风格适应自己的角色定位。比如在和老年人对话时,使用平和缓慢的语气,而在担任经理下达命令时又采取果断坚决的态度。

红星新闻记者 王雅林 实习生 郑直

责编 官莉 编辑 郭宇

(下载红星新闻,报料有奖!)

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
GPT-4取代数据分析师,成本仅3000!阿里达摩院\u0026NTU论文引热议..
编辑:编辑部【新智元导读】GPT-4淘汰数据分析师,仅需几千元。近来,想..
实测国产ChatGPT智能聊天机器人“文心一言”对宝马MINI事的解读..
评价一款聊天机器人对热点事件的理解能力,需要从以下几个方面考虑:知识..
OpenAI CEO首次来华演讲:未来10年内会有超强AI诞生
6月10日,OpenAI创始人Sam Altman以视频连线的方式参加于北京举办的2023..
才知道!原来微信可以偷偷查看对方消息,还不会被发现,很实用!..
在互联网飞速发展的时代,人们的消费观念以及生活方式也都得到了不同程度..
微软又向OpenAI狂砸100亿美元!巨头AI大棋下4年,谁是最大赢家?..
编辑:编辑部【新智元导读】AI领域群雄激战,到了2023年,微软逐渐显出了..
ChatGPT从小白到专家之路:二、GPT能做什么?GPT3.5VS4 怎么选?..
gpt可以做什么?ChatGPT-3.5 和 ChatGPT-4.0 应该如何选择使用?一、GPT..
24小时秒回的虚拟朋友?百度输入法首创AI侃侃,解决情感寄托需求..
由于生活方式的改变,现代年轻人或主动或被动,都变得越来越孤独。据调查..
两性交往,频繁聊这6个话题,女人多半会失去抵抗力
问题:怎么才能每天都收到这种文章呢?答案:只需要点击右上角“关注”即..
OpenAI有可能破产吗?(AI分析AI公司)
【Ask Bing Chat:#OpenAI有可能破产吗?#】根据搜索到的信息,OpenAI是..
关于作者
国务院环卫工..(普通会员)
文章
500
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40335 企业收录2981 印章生成194959 电子证书832 电子名片53 自媒体26195

@2022 All Rights Reserved 浙ICP备19035174号-7
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索