> 自媒体 > (AI)人工智能 > GPT-4满分通过MIT本科数学考试!却遭同门质疑“作弊”,数据集本身就有问题
GPT-4满分通过MIT本科数学考试!却遭同门质疑“作弊”,数据集本身就有问题
来源:大数据文摘
2023-07-08 11:34:02
483
管理

论文链接:

https://huggingface.co/papers/2306.08997

这样的结果自然也是吸引到了众多网友的讨论,在网友们的一众惊呼声中,三位同样来自MIT的学生却发现了其中端倪。

揭开“网骗”GPT-4的面纱

在6月16日发现这篇论文后,三人决定深入挖掘一下。但是一小时内,他们对论文的方法论产生了怀疑,不到两个小时,他们意识到,数据集本身是有问题的。

论文中写到,研究人员“在没有图像和有解决方案的问题中随机选择了288个问题的测试集”。这个数据集(不包括用于微调开源LLM的训练集)也随着论文的发布被开源到了GitHub上,以及用于生成报告的测试性能代码。

然而,Drori教授却删除了这个项目。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
ChatGPT 在B2B产品营销场景下的落地实践
随着ChatGPT的发展,我们可见地它已经逐渐应用到各行各业,或提高工作效..
GPT-4 开始内测 32000 输入长度的版本了!你收到邀请了吗?..
夕小瑶科技说 原创作者 | 小戏、ZenMoore要说现在 GPT-4 最大的问题是什..
OpenAI在中国申请注册“GPT-5”商标!GPT-4发布仅5个月, GPT-5就要来了吗..
每经编辑:黄胜企查查APP显示,近日,欧爱运营有限责任公司(OpenAI OPCO..
硬核观察 #898 OpenAI 雇佣上千人改进 AI 的编程能力
OpenAI 雇佣上千人改进 AI 的编程能力OpenAI 过去半年招募了大约一千名远..
OpenAI 招聘人员正试图用 1000 万美元的薪酬吸引谷歌的人工智能员工..
OpenAI 刚刚升级了与谷歌的人才争夺战。据 The Information 报道,这家人..
微软获GPT-3独家授权,可访问底层代码,API用户继续使用..
杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI微软今天宣布,获得OpenAI..
太吓人了!ChatGPT-4竟想逃出电脑,现在拔插头还来得及吗?..
很多人可能都看过《猩球崛起》这部电影,被囚禁的人猿在黑猩猩凯撒帮助下..
A股没有“中国版ChatGPT”
本文来源:时代周报 作者:杨玲玲继被玩坏的Siri和打败人类围棋赛的Alpha..
低代码迎来重大突破!微软启用超级模型GPT-3,路人秒变程序员..
近日,一年一度的微软开发者大会如期召开,本次大会以数字化转型和商业赋..
关于作者
巫月(普通会员)
文章
448
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40334 企业收录2981 印章生成191017 电子证书816 电子名片51 自媒体24671

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索