> 自媒体 > (AI)人工智能 > GPT-4没通过图灵测试!60年前老AI击败ChatGPT,人类胜率仅有63%
GPT-4没通过图灵测试!60年前老AI击败ChatGPT,人类胜率仅有63%
来源:天意观科技
2023-12-07 15:56:37
497
管理

“智能之火,人类渴求已久的梦想,现在终于被AI点燃。”当ChatGPT问世时,全球媒体争相报道人工智能技术的日新月异。ChatGPT那流畅的语言表达,广博的知识面,强大的创作能力,让世人为之惊叹。“终于有AI通过图灵测试了!”很多人由衷地赞叹。

然而就在最近,来自加州大学圣地亚哥分校(UCSD)的研究人员对ChatGPT等新一代语言模型进行了图灵测试。结果令人震惊,现今最强AI ChatGPT,不仅没有通过测试,反而被一个60年前的老AI系统击败。这场看似AI之间的PK,其实更凸显了图灵测试本身的局限。

能过五关斩六将的ChatGPT,似乎无所不能,深谙人性,几乎达到了人类智能的高度。外界一致看好它通过图灵测试——那项被视为AI智能最终评判的考验。

二、 60年前老AI系统ELIZA:规则AI的巅峰之作

在这场看似AI技术发展进程的大比拼中,鼎鼎大名的ChatGPT并非最终赢家。让所有参与者大跌眼镜的是,一个60年前基于规则的老AI系统ELIZA,在图灵测试中表现更胜一筹,成功骗过了27%的人类。

三、 图灵测试的局限:评判AI智能的金标准还需改进

这场看似前沿AI对决老AI的比试,突显了图灵测试本身的严重局限性。正如论文作者指出,测试结果“再次验证了一个结论:图灵测试并不是判断AI智能高低的测试”。

这里值得深究的是,测试人员判断ELIZA为人类的关键原因,居然是因为“我问它问题它都不回答,没有表现得很热情或者唠叨”。也就是说,违背常识的并不是ELIZA的能力,而是人类参试者关于什么是人工智能的先入为主观念。这种“ELIZA效应”严重影响了测试结果的客观性与有效性。

显然,任何测试都不可能在百分之百隔绝主观假设的影响,但这正是对测试方法不断优化的需要。图灵测试作为评价AI系统智能的金标准检验,必须面对自身显著的弊端,亟待提升科学性和适用范围。

目前看来,单一依赖主观人机交互结果的图灵测试,很难客观准确地Predict未来AI的进展。这场老AI反超新AI的图灵大战,正如敲响=(),提醒我们:要审视图灵测试,完善评价体系,拓宽研究视野。只有这样,才能与AI的实际发展步调一致,共同绘就美丽的未来。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
御赐铲屎官..(普通会员)
文章
813
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40394 企业收录2981 印章生成234170 电子证书1033 电子名片60 自媒体46877

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索