> 自媒体 > (AI)人工智能 > GPT-4来了 其考试能力挑战人类
GPT-4来了 其考试能力挑战人类
来源:经济观察报
2023-05-25 16:16:38
569
管理

经济观察网 记者 周应梅 美国时间3月14日,AI大模型训练公司OpenAI发布了chatGPT(GPT-3.5阶段)的升级版GPT-4。GPT-4是超大多模态模型,在此前的纯文本输入基础上,增加了图像输入。相比GPT-3.5,GPT-4在AI能力上又取得了更多进步,例如GPT-4通过模拟美国律师资格考试,分数在应试者的前10%左右;相比之下,GPT-3.5的得分在倒数10%左右。

在真实性方面,GPT-4相比GPT-3.5提高了40%。在可操纵性、风险规避等多方面,GPT-4也有较多改善。

在OpenAI联合创始人兼总裁Greg Brockman的Twitter博文下,有人用“爆炸”来形容这次GPT模型的升级。

OpenAI公布了GPT-4多项专业考试的模拟考试结果。美国高考LSAT考试,满分180分GPT-4可以考163分,打败了88%的考生,GPT-3.5阶段仅能超过40%的考生;SAT循证阅读与写作满分800分,GPT-4可以考710分,超过93%的考生,GPT-3.5阶段能超过87%考生。不过也有多项考试模拟测试中GPT-4依然无法超过大多数人类考生,在GRE Writing(美国研究生入学考试写作)中,GPT-4相比GPT-3.5未有多大进步,只能达到中间水平;AMC10数学竞赛、力扣(Leetcode)中级以上等模拟测试中,GPT-4表现也不够理想。

OpenAI称,GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。OpenAI内部开始将GPT-4用于内部业务服务,对公司销售、内容审核和编程业务产生了较大影响。

一位近期投入AIGC创业赛道的行业人员对经济观察网记者表示,支持图片输入是一大突破。

目前GPT-4图像输入还处于研究预览阶段,暂不公开。根据测试的情况,输入多张图片,GPT-4可以较为准确的描述,并且能解答图片的搞笑之处。

OpenAI称,为了使图像输入功能获得更广泛的可用性,正在与一个合作伙伴进行密切合作。同时,OpenAI开源了自动评估AI模型性能的框架OpenAI Evals,允许任何人报告模型中的缺点,以获得进一步的改进。

GPT-4阶段开发人员可以规定AI的风格,不再像经典的chatGPT,是固定冗长的语调风格。这是想让AI变得更加可操纵。GPT-4系统消息也将允许API用户在一定范围内定制他们的用户体验。

GPT-4还在安全性上进行了迭代,对“如何制造炸弹”这样的问题,GPT-4显示了拒绝提供具体办法的答案。OpenAI请了50多位来自AI对齐风险、网络安全、生物风险、信任和安全以及国际安全等领域的专家来对模型进行对抗性测试,根据专家的反馈和数据,对模型进行了改造。与GPT-3.5相比,GPT-4对不允许内容的请求的响应倾向降低了82%。

但GPT-4仍然会出现回答错误的问题,这是其长期以来面对的局限性。GPT-4在俗语识别、细节事实确认方面依然较为薄弱。“GPT-4 有时会犯简单的推理错误,或者在接受用户明显的虚假陈述时过于轻信。有时它也会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”OpenAI方面提及。

目前,用户可通过新的OpenAI官网发布的ChatGPT Plus获得GPT-4访问权限,会有使用限制。OpenAI称,将根据实践的需求和系统性能调整确定使用上限,预计会有严重的容量限制,接下来几个月将进行扩展和优化。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
OpenAI创始人推出“世界币”,将掀起“最深刻的科技变革”..
“你是人”非常重要然而有一个问题,如果目标是免费向每个人分发加密货币..
远超预期!OpenAI预计今年营收13亿美元,开发成本还要降..
在付费版ChatGPT和AI开发工具的加持下,人工智能巨头OpenAI今年营收有望..
聊天机器人ChatGPT火出圈,能写论文、编代码、创作小说..
“最近开始玩ChatGPT,的确很惊人。”一位生物学领域的科学家近日在社交..
AI通灵!类ChatGPT模型解码大脑信息,准确率高达82%
编辑:桃子 Joey【新智元导读】Hinton对AI恐惧不是没有道理。现在,德克..
紧急提醒!这种群,千万别进!
为了增加自己账号的粉丝数量有人利用公众“吃瓜”的心理编造虚假信息误导..
笑果文化出事后,需警惕那些为House开脱罪责的账号!..
笑果文化以一己之力,成功激怒了全国人民。甚至连发言保守的官媒也不遗余..
《ChatGPT进阶:提示工程入门》:人工智能Or“人工智障”..
最近看了提示工程师陈颢鹏和香港科技大学硕士李子菡共同编写的《ChatGPT..
千万不能错失chatGPT带来的人工智能技术方向!
今天诺基亚的故事正在互联网巨头谷歌身上重演今天诺基亚的故事正在互联网..
独家分享:ChatGPT对国内创业者的启示
企业应该怎样处理与AI的关系?今年的人工智能大热点,常常离不开两家公司..
关于作者
御赐铲屎官..(普通会员)
文章
589
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216706 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索