> 自媒体 > (AI)人工智能 > GPT-4能“伪装”成人类吗?图灵测试结果出炉
GPT-4能“伪装”成人类吗?图灵测试结果出炉
来源:不容易cc
2023-11-14 13:29:23
196
管理

最近,有研究人员对GPT-4进行了图灵测试,看它是否能成功“伪装”成人类。结果发现,GPT-4欺骗人类的成功率可达41%,甚至1966年的ELIZA都能战胜它。这说明AI模仿人类的能力正在快速提升,未来会对社会带来巨大影响。

究竟图灵测试揭示了GPT-4什么样的“真面目”?它是否已经可以无障碍地伪装成人类?我们一起来看看这场考验结果吧!

652名人类参与者被分配成审问者和见证者角色,与AI对话来判断对方是人类还是机器。结果显示,GPT-4中的Sierraprompt成功率可达41%,November和Papa也有36%~40%。相比之下,人类参与者的成功率是63%。

尽管部分GPT-4提示语超过了30%的标准,但距离随机猜测50%的基准还有一定差距。研究者认为,要判断AI是否具有人类水平的欺骗能力,成功率至少应与人类参与者持平。所以这意味着GPT-4还未完全通过图灵测试。

但是,部分提示语已经能在三分之一的时间里欺骗人类,这表明GPT-4模仿人类的能力正在快速增强。

更令人惊讶的是,1966年诞生的ELIZA竟在27%的游戏中胜过人类审问者,明显强于GPT-3.5和一些GPT-4提示语。ELIZA只是利用了模式匹配和词语替换的简单规则,并没有强大的深度学习技术。

这说明传统的基于规则的AI也可实现欺骗。相比直接模仿人类思维,找到人类语言交流中的漏洞可能更容易达成欺骗。这也进一步证明图灵测试并不能完全反映一个AI系统的全面智能水平。

研究者分析了参与者使用的不同策略。简单的闲聊对GPT-4毫无作用,而让AI回答外语、讨论时间或使用直白问句能更准确区分人机。

我们平时也许很难意识到语言细节中的破绽,但这场交流博弈正在悄悄改变着。

本研究表明,GPT-4在语言风格、社交情感、知识推理上还存在短板,这些都是审问者判断AI的重要线索。

但与此同时,部分提示语已经能以41%的成功率伪装成人类,这是一个值得警惕的信号。

未来的语言模型如果性能持续提升,很可能会产生广泛的社会影响。它们可能被用来自动化客户服务岗位、大规模传播虚假信息等。

区分人类和AI的能力将变得越来越重要。

本次图灵测试既展示了GPT-4欺骗人类的可能性,也暴露了它欺骗过程中的弱点。我们还需继续研究,以更准确理解AI与人类思维的差异,并对其给社会带来的影响保持清醒和警惕。

结语:

本次图灵测试中,GPT-4的表现确实令人惊叹。它模仿人类的能力已经相当强大,有必要引起我们的重视。

但与此同时,它欺骗人类的成功率还远未达到随机基准,也显然不如人类。完全的“伪装”还任重道远。

(图片和数据来源于网络,具体请理论请自己查证,本文章不代表作者观点,如有侵权,请联系删除)

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
天外天(普通会员)
文章
379
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成186821 电子证书796 电子名片49 自媒体20829

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索