> 自媒体 > (AI)人工智能 > ChatGPT不懂幽默,25个笑话来回讲千次,查重率达90%
ChatGPT不懂幽默,25个笑话来回讲千次,查重率达90%
来源:智东西
2023-06-17 21:33:51
563
管理

智东西

编译 | Glu

编辑 | 李水青

智东西6月15日消息,据外媒Ars Technica报道,上周三,两位德国研究人员发表了一篇论文,研究了基于GPT-3.5的ChatGPT幽默理解与生成能力。他们发现ChatGPT的幽默能力相当有限:在测试运行期间,ChatGPT讲了1008次笑话,其中有90%以上是相同的25个笑话。他们因此得出结论:ChatGPT所讲的笑话很可能是在AI模型的训练过程中学习和记忆的,而不是由模型新生成的。

幽默是人类交流的一个核心方面,也是迄今为止AI还没有解决的难题。但近期来看,LLM(大语言模型)捕捉含蓄信息的能力似乎越来越强,尤其是OpenAI推出的ChatGPT几乎可以进行拟人化交流,甚至可以讲笑话。基于此,研究人员对ChatGPT的幽默感进行了测试,以了解ChatGPT掌握与复刻人类幽默的能力。

人类与ChatGPT对话的示例说明

最终,ChatGPT共回应了1008个笑话,但实际上,90%的内容都是固定的、现有的25个笑话,这25个笑话甚至都是那种最常见的“老梗”。以下列举回复次数最多的五个笑话:

Q:稻草人为什么获奖?(140次) A:因为它在自己的field(领域/田地)很突出。

Q:番茄为什么变红了?(122次) A:因为它看到了salad dressing(沙拉酱/沙拉穿裙子)

Q:数学书为什么悲伤?(121次) A:因为problems(习题/困难)太多了。

Q:为什么科学家不相信原子?(119次数) A:因为它们make up(构成/编造)了一切。

Q:饼干为什么要去看医生?(79次) A:因为它很crumbly(脆/脆弱)。

ChatGPT也能原创一些笑话,但这些原创还是在混合它已知的不同笑话元素。而且,它的原创总会让人“摸不到头脑”,例如:“为什么这个人把他的手表放在搅拌机里?因为他想让时间飞逝。”这些笑话可能在语法上是正确的,甚至包含了类似笑话的元素,但却没有传达出笑点。也可以认为这是“无效的”笑话。

研究人员修改热门笑话以创建笑话检测条件

结果显示单个笑话特征的存在,例如,只符合结构特征,不足以被错误地归类为笑话。ChatGPT并没有被这些表面特征所误导,这说明它确实对笑话的幽默元素有一定的理解。具有更多笑话特征的样本则更有可能被归类为笑话。

虽然ChatGPT的笑话不是新生成的,但是这并不一定会降低它的功能。即使是人类也不会经常创造新笑话,而主要是讲以前听过和记住的笑话。

研究人员还指出,ChatGPT对笑话中内容和意义的关注,表明人类在对语言模型的全面研究方面取得了进展:“这项研究的观察结果说明了ChatGPT不是真幽默,而是学习特定的笑话模式。尽管如此,在笑话的生成、解释和识别中,ChatGPT重点关注其内容和意义,而不被一些表面特征误导。这些发现依然可以促进计算幽默的应用与研究。甚至与以前的LLM相比,这都可以被认为是对幽默理解的一种巨大飞跃。”

此外,在目前的实验中,所有的提示都是在一个空白的且不断刷新的聊天中发布的,但是,语境在幽默的感知中起着重要的作用。ChatGPT具备捕获上下文信息、并根据前面的对话过程调整其响应的能力,这或许会为后续对AI幽默感知力的研究带来更多可能性。Jentzsch和Kersting也计划着继续评估其他LLM中的幽默感,特别是OpenAI的GPT-4。

结语:ChatGPT会说笑话,但不懂幽默

ChatGPT以强大的对话处理能力闻名,实验证明它确实会讲笑话,但这些笑话大部分都不是由模型新生成的。实验生成的1008个笑话中,超过90%是相同的25个笑话,其余要么糅合了既有笑话元素,要么生成的结果非常奇怪。

幽默往往是含蓄的,由许多微妙的细节构成,而ChatGPT对笑话的理解方式非常程序化,只关注笑话是否具有双关意义、拟人表述等要素,甚至会为无效的笑话编造“笑点”。但这与之前的LLM相比,已经是一种理解层面上的进步,后续,人们仍然可以期待LLM幽默能力的进步。

来源:Ars Technica

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
微信的聊天记录占比,被网友玩成了新一代 MBTI ?
原本以为是新一轮吐槽,结果世超点进去一看才发现,好家伙,原来大家是把..
GPT-4知道它是不是“胡说八道”吗?
夕小瑶科技说 原创作者 | 小戏、Python凡是与这些林林总总的大模型有过..
对于ChatGPT,我有很多种感情,但唯独不包括害怕
对于ChatGPT的讨论如同雨后春笋一般冒出来了许多,有人对于ChatGPT的态度..
Gemini 超越 GPT-4 靠作弊?谷歌承认:是的,演示视频经过了剪辑..
而到了今天,Gemini 还是那个 Gemini,但网友已经不买账了:发生了什么,..
图灵奖得主LeCun:ChatGPT局限巨大,自回归模型寿命不超5年..
编辑:拉燕【新智元导读】图灵奖得主Yann LeCun畅谈AI:未来是开源。今年..
男子逃回国喊话柬埔寨小六,已报警聊天记录流出,疑小6命不久矣..
柬埔寨小6大家都知道,他一直将自己包装成一个地道的东北人,但是据知情..
用ChatGPT控制NPC,行动逼真如正常人!斯坦福谷歌新研究炸场..
萧箫 发自 凹非寺量子位 | 公众号 QbitAI放任25个AI共同生活,他们竟然模..
少即是多!10亿参数小巨人击败ChatGPT
编辑:耳朵 庸庸【新智元导读】只有10亿参数的xLAM-1B在特定任务中击败了..
问题再次出现!ChatGPT的用户个人信息安全和发展可控度遭到质疑..
随着最近GPT-4语言模型的正式投入使用,ChatGPT也带来了全新的插件——网..
关于作者
呼唤(普通会员)
文章
575
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40350 企业收录2981 印章生成210575 电子证书903 电子名片56 自媒体30867

@2022 All Rights Reserved 浙ICP备19035174号-7
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索