GPT-4满分通过MIT本科数学考试！却遭同门质疑“作弊”，数据集本身就有问题-脚本导航

> 自媒体 > （AI）人工智能 > GPT-4满分通过MIT本科数学考试！却遭同门质疑“作弊”，数据集本身就有问题

GPT-4满分通过MIT本科数学考试！却遭同门质疑“作弊”，数据集本身就有问题

来源：大数据文摘

2023-07-08 11:34:02

725

管理

论文链接：

https://huggingface.co/papers/2306.08997

这样的结果自然也是吸引到了众多网友的讨论，在网友们的一众惊呼声中，三位同样来自MIT的学生却发现了其中端倪。

揭开“网骗”GPT-4的面纱

在6月16日发现这篇论文后，三人决定深入挖掘一下。但是一小时内，他们对论文的方法论产生了怀疑，不到两个小时，他们意识到，数据集本身是有问题的。

论文中写到，研究人员“在没有图像和有解决方案的问题中随机选择了288个问题的测试集”。这个数据集（不包括用于微调开源LLM的训练集）也随着论文的发布被开源到了GitHub上，以及用于生成报告的测试性能代码。

然而，Drori教授却删除了这个项目。

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

一份来自Huggingface的大模型进化指南：没有必要完全复现GPT-4

2023-07-08 11:38

中国首发AI自动设计CPU芯片：比GPT-4强4000倍

2023-07-08 11:31

相关文章

专访王小川|曾预言过ChatGPT方向，年内推出中国版ChatGPT PRO..

ChatGPT引燃了一轮AI创业潮，无数头顶光环的企业家入局，王小川也是其中..

法媒关注中国国产ChatGPT

据《费加罗报》8月31日报道，百度发布的“中国版ChatGPT”聊天机器人文心..

中国版ChatGPT正在血洗职场：你的饭碗还能端多久？

"我用DeepSeek写周报被主管连夸三天，现在慌得睡不着觉。"凌晨2点，某互..

荐书丨《ChatGPT来了：语言科学如何看待ChatGPT》

ChatGPT来了基本信息副标题：语言科学如何看待ChatGPT作者: 杨旭 / 罗仁..

ChatGPT vs DeepSeek - 中文语法推理

问题：“你这铺馆没字号，就叫狗不理吧。 ” 这句话当中的 “就” 是个介..

ChatGPT时代语料库与术语库建设与应用工作坊

戴光荣博士，广东外语外贸大学教授，原福建工程学院人文学院院长，福建省..

“请不要对我有过高的期望，我仅是一个AI模型”丨对话ChatGPT..

当地时间2023年2月1日，瑞士高中教师参加了关于ChatGPT的研讨会。（视觉..

新闻可信度评估机构：ChatGPT或成传播网络谣言最强工具..

由OpenAI开发的人工智能聊天工具ChatGPT在全球引发广泛关注，众多用户尝..

对话调教ChatGPT，居然变成在线犯罪指南！

关于作者

巫月(普通会员)

文章

858

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

DeepSeek 究竟是个啥？一文带你看明白

1个月前

04

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

05

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

标签云

成员 网址收录40394 企业收录2981 印章生成234629 电子证书1034 电子名片60 自媒体46877

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索