论文链接:
https://huggingface.co/papers/2306.08997
这样的结果自然也是吸引到了众多网友的讨论,在网友们的一众惊呼声中,三位同样来自MIT的学生却发现了其中端倪。
揭开“网骗”GPT-4的面纱
在6月16日发现这篇论文后,三人决定深入挖掘一下。但是一小时内,他们对论文的方法论产生了怀疑,不到两个小时,他们意识到,数据集本身是有问题的。
论文中写到,研究人员“在没有图像和有解决方案的问题中随机选择了288个问题的测试集”。这个数据集(不包括用于微调开源LLM的训练集)也随着论文的发布被开源到了GitHub上,以及用于生成报告的测试性能代码。
然而,Drori教授却删除了这个项目。
相关文章
猜你喜欢