上周,GPT-4横空出世,专业考试成绩大幅提升!但它真的成为了一名优秀学霸,还是只是一个作弊达人?
普林斯顿大学的研究人员认为,开发ChatGPT的OpenAI打破了一个基本原则,即在已经接受训练的数据上进行测试。这意味着GPT-4在参加美国律师资格考试等专业测试时,可能已经看过问题,并从记忆中简单地复述答案。Arvind Narayanan和Sayash Kapoor的《AI蛇油》时事通讯深入探讨了这一争议。
Narayanan和Kapoor还提到,当一个MBA测试问题的措辞被改变时,ChatGPT被愚弄了,显示出AI较浅层次的推理能力。他们认为,我们需要更好的方法来衡量AI在现实任务中的影响和能力。
Kortical的Alex Allan认为,OpenAI对考试基准的强调要么是虚伪,要么是无能。他表示,我们离“人类水平”的AI仍然很遥远。
那么,ChatGPT-4真的像看起来那么令人印象深刻,还是我们只是在见证一个学会作弊的AI达到顶峰呢?
相关文章
猜你喜欢
成员 网址收录40384 企业收录2981 印章生成228476 电子证书1002 电子名片58 自媒体44239