> 自媒体 > (AI)人工智能 > GPT-4 未通过图灵测试,GPT-3.5 还败给六十年前的老 AI 系统,最新研究出炉!
GPT-4 未通过图灵测试,GPT-3.5 还败给六十年前的老 AI 系统,最新研究出炉!
来源:CSDN
2023-12-13 14:15:34
338
管理

也有人表示,“图灵测试实际上是一种超窄的方法。图灵令人难以置信的优点是毋庸置疑的。但图灵测试范式对于几十年来人工智能的项目和发展来说绝对是致命的。”

比较人类和机器的智能水平,引发争议的图灵测试

所谓图灵测试,是由英国数学家和计算机科学家艾伦·图灵(Alan Turing)于 1950 年提出的一个测试概念,用于评估机器是否具有人类智能。这个测试的核心思想是,一个人类评判者通过对话形式,与一个机器和一个人类进行交互,然后在不知道对话对象的真实身份前提下,判断哪个是机器,哪个是人类。

具体来说,图灵测试的步骤如下:

1. 一个评判者(通常是人类)在与两个对话对象进行文本交流时,其中一个是机器,另一个是人类。这个交流可以通过键盘和在屏幕输入进行,以确保评判者无法通过声音或外观来判断对话对象的身份。

2. 评判者的目标是在与两个对象交流后,准确地区分出哪个是机器,哪个是人类。

3. 如果机器成功地使评判者无法区分其回答与人类的回答,那么这台机器被认为通过了图灵测试,表现出具有人类智能的迹象。

值得注意的是,图灵测试并没有明确规定机器需要模仿人类的所有方面,而是强调机器是否能够在对话中表现出类似于人类思维和智能的特征。图灵测试成为人工智能领域中一个重要的思想实验,用于探讨和评估机器智能的发展。

研究人员希望利用图灵测试来了解聊天机器人的人性化特征。不过一直以来,因为主观性和相对性、缺乏客观标准等因素,图灵测试就成了确定机器模仿人类对话能力的一个著名但有争议的基准。

研究人员变化了提示的几个方面, 包括模型是否应产生拼写、语法和大小写错误;模型应该采用的人格;模型被告知其是人类还是假装是人类的 AI。所有提示都包含关于游戏说明的通用信息,以及它们的训练结束日期之后发生的重要事件。在每场游戏开始时,会从一个列表中为模型的人格生成一个建议名称。提示还包括游戏创建的时间戳和最新消息的时间戳。

值得一提的是,这项研究获得了加州大学圣地亚哥分校 IRB 的批准,所以研究人员 Cameron Jones(认知科学专业博士生)和 Benjamin Bergen(该校认知科学系教授)建立了一个名为 turingtest.live 的网站,此网站提供一个看起来像一个传统的消息应用程序的聊天界面。

然后,参与者进入等待室,在那里他们会被随机分配与另一个人类或 AI 进行游戏。调查员发送第一条消息,每个用户一次只能发送一条消息。整个对话有 5 分钟的时间限制,单个消息有 300 个字符的限制。

在双方聊天过程中,调查员最常用的策略包括闲聊以及询问相关知识和时事。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
日“烧”508万,OpenAI只能活到2024?
撰稿丨千山日前,据外媒Analytics India Magazine报道,综合各项数据分析..
抓紧收藏,我尝试、测试和评估了60个数据科学的ChatGPT提示..
#头条创作挑战赛#我为数据科学评估了60个ChatGPT功能,使用这些提示并请C..
未来可期|ChatGPT到底厉害在哪?百科全书版聊天机器人已诞生..
春节之际,祝福着我们的家人和朋友,愿快乐伴随着你们的左右,烦恼被真诚..
听李宏毅点评GPT-3:来自猎人暗黑大陆的模型
编者按:提起李宏毅老师,熟悉 AI 的读者朋友一定不会陌生。在 GPT-3 推..
OpenAI CEO回应AI担忧:全球监管可以应对重大风险,但不应过度..
OpenAI CEO回应AI担忧:全球监管可以应对重大风险,但不应过度OpenAI CEO..
利用AI散布谣言 \u0026#34;杀猪盘\u0026#34;延伸黑链条……网络安全防火墙..
来源:央视新闻客户端 9月11日至17日,2023年国家网络安全宣传周在全国范..
可能是最简单的本地GPT3 对话机器人
毫无疑问,gpt是目前最火的人工智能方向,已经商用的有OpenAI公司原生的G..
微信聊天时,女人说“哼哼”,10个高情商回复
当女人在微信聊天时说“哼哼”,这是一个非常微妙且具有深意的表达,需要..
OpenAI 如何如此彻底地搞砸了 Sam Altman 的解雇
OpenAI 前首席执行官萨姆·奥尔特曼OpenAI 的监管者担心该公司正在制造相..
关于作者
冷冷的太阳..(普通会员)
文章
454
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40335 企业收录2981 印章生成194244 电子证书831 电子名片53 自媒体26178

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索