GPT-4性能之谜：新版本真的比老版本差吗？-脚本导航

> 自媒体 > （AI）人工智能 > GPT-4性能之谜：新版本真的比老版本差吗？

GPT-4性能之谜：新版本真的比老版本差吗？

来源：AIGC头号玩家

2023-08-10 08:15:22

468

管理

GPT-4的性能在时间推移中越来越差，而不是越来越好。

很多人报告说，模型的响应质量显著降低，但到目前为止，这都是凭个人经验而非客观数据。

有一项研究表明，6月份发布的GPT-4版本在一些任务上的表现要比3月份发布的版本更差。

代码生成也变得更糟了。

该团队创建了一个包含50个来自LeetCode的简单问题的数据集，并测量了多少GPT-4答案在不做任何更改的情况下能够运行。

3月份的版本在52%的问题上成功了，但使用6月份的模型后，这一数字降至惨淡的10%。

有传言称，他们正在使用几个更小和专业化的GPT-4模型，这些模型的行为类似于一个大模型，但运行成本较低。当用户提出问题时，系统会决定将查询发送到哪个模型。

更便宜、更快，但这种新方法是否是质量下降背后的问题？

在我看来，这对于任何依赖于GPT-4构建应用程序的人来说都是一个不好的信号。LLM的行为随着时间的推移而改变是不可接受的。

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

抛弃免费：追求优质的GPT-4体验

2023-08-10 08:18

GPT-4外逃计划曝光！斯坦福教授发现它正引诱人类帮助，灭绝之门

2023-08-10 08:12

相关文章

让谷歌、苹果“急了眼”的ChatGPT，为什么说它是颠覆性的？..

读创/深圳商报首席记者陈小慧能与人类“对答如流”，会写策划方案和调研..

男子开价1万元，售卖“与20岁女网友见面机会”？警方回应..

4月27日，有网友发帖爆料：在某微信群聊中，一男子开价1万元，售卖和20岁..

微信聊天记录如何成为有效证据？

朋友在微信上问自己借钱有聊天记录，却没有借条凭证打官司时要怎么办？微..

ChatGPT中文调教指南，提示词是关键！

怎么用好ChatGPT？ChatGPT非常强大，其核心是Prompt，ChatGPT 的回复质量..

适合国外用的安全秘密聊天工具

在如今的信息时代，我们频繁使用聊天软件交换信息，个人的信息安全也因此..

北京将打造“自然科学界的ChatGPT”

北京日报客户端 | 记者刘苏雅近期，科技部会同自然科学基金委启动了“人..

国内科技巨头开卷ChatGPT，资本狂欢的背后，是更大的隐忧..

#ChatGPT#不知道大家听说过ChatGPT吗？最近这段时间ChatGPT在网络上的热..

直男能让女生舒服爆的6类聊天话题

国产“ChatGPT”已超70多家，科大讯飞钟锟：“赛马”将跑出世界级的大模型..

8月9日，科大讯飞正式发布新一代智能办公本X3，全面应用了讯飞星火认知大..

关于作者

横道不笑(普通会员)

文章

624

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

04

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

05

OpenAI突发更新！GPT-3.5正式开放微调，人人可打造专属ChatGPT

2023/08/26

标签云

成员 网址收录40369 企业收录2981 印章生成216706 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索