GPT-4计算能力差怎么破？把它当小学生，保证结果跟计算器一样准-脚本导航

> 自媒体 > （AI）人工智能 > GPT-4计算能力差怎么破？把它当小学生，保证结果跟计算器一样准

GPT-4计算能力差怎么破？把它当小学生，保证结果跟计算器一样准

来源：量子位

2023-08-01 11:56:05

522

管理

丰色发自凹非寺

量子位 | 公众号 QbitAI

大语言模型的数学能力到底怎么破？

一位数学本科生发现：

实际上，咱们只需像一年级小学生一样教它们“掰着手指头算”，就能让它立马变身数学小能手。

比如像“34756918247632 7934619867453210082”这样的大数加法，任你丢给哪个大模型，即使强如GPT-4，都算不明白。

但如果你按照他说的做，保证结果跟用计算器摁出来的一模一样。

（ps. 可以看到计算第二位的7 6 c时作者写错了，应该等于14，导致最终结果也错了，但这压根不影响，只要思想是对的，模型就能get到！）

对于第二个例子，步骤也一样，主要不同之处在于这次不需要补0——把人家当作小学生，就得把每种情况都讲明白。

所以说，大语言模型还是很聪明的，只要你会教，数学计算能力压根没问题。

为什么算不对？

想必大家也会好奇，为什么要像小学生这样教它们才能做对这样的数学题呢？

作者分析，有两大原因：

一是模型在处理文本输入时会进行的tokenization操作，导致数字被多个组合在一起变成一个个token。

比如咱们今天算的这道，在GPT-4眼里它看到的其实是这样的：

这也就是为什么我们需要用空格将每个数字隔开，GPT-4才不会进行拆分，才有算对的可能性。

当然，如果你仅仅是加了空格不用上面的方法教它，它也算不对。

这就引出第二个原因：没有给够它上下文学习的空间来进行计算。

GPT-4是一种自回归语言模型，这意味着它某个时间步的输出以所有先前的输出为条件，就像小学生做题一样，我们需要一种方法让我们的模型能够一步一步地检索到任何位置的数字。

因此，就需要给它设定如上的模版，让它“有迹可循”。

最后作者表示，语言模型不同于我们以前构建的任何类型的软件。所以需要一些特别的耐心。

那么，理解了以上这两个原因，大家是不是也就能更好地理解上面一系列如教小学生似的提示词操作了？

作者介绍

本方法作者名叫Karthik Balaji，是滑铁卢大学数学本科生。

据个人主页介绍，他对大语言模型非常感兴趣，最近正在开始研究生成模型，尤其是扩散类型，并已经有一些小小的产出，大家感兴趣的可以去翻阅。

原文地址：

https://okarthikb.github.io/site/blog/detailed-prompting.html

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

GPT-4「变笨」被斯坦福实锤：短短仨月数学问题错误率暴涨40倍！

2023-08-01 11:59

GPT-4被用户抱怨变得“懒”且“蠢” 或是重设架构惹的祸

2023-08-01 11:54

相关文章

颜值、科技与性能巅峰对决，小米SU7领衔，国产网红轿车四强争霸..

当今汽车行业，新能源浪潮正以排山倒海之势席卷而来。纯电轿车市场，无疑..

空间大、配置高、颜值顶，又一高性价比家用轿车，宝骏享境来了..

近日，宝骏品牌发布了旗下全新中大型轿车——宝骏享境的官方图片。作为宝..

今年最值得买的3款轿车，口碑高空间大，舒适耐用，家用没毛病..

选购家用轿车时，消费者评价高的车型往往具备多重优势：过硬的核心品质保..

2024年轿车销量榜出炉，各级别的销冠都有谁？

紧凑型车销冠：轩逸紧凑型车的销冠是老面孔了，来自东风日产的燃油车——..

没人开燃油车？2025年燃油轿车排名：十款有九款单月销量破1万辆..

在汽车工业快速变革的今天，新能源车的崛起仿佛一夜之间改变了行业的游戏..

一汽-大众速腾轿车迎2025二次改款：新增自适应巡航，15.89万..

IT之家 4 月 1 日消息，一汽-大众现已为其 2025 款速腾轿车推出二次改款..

大混战时代！这五台20万级爆款轿车全是狠角色！

我们之前做过好几期盘点，从几万块的小车到主流市场的10万级，15万级，终..

新车 | 尊界S800/奥迪A5L/比亚迪汉L/仰望U7等，2025年重点轿车盘点..

文：懂车帝原创史景旭[懂车帝原创产品] 在过去的一年里，汽车市场竞争..

销冠级轿车上新，更强了却还是10万级，探店海豹06 DM-i智驾版..

前年冠军版、去年荣耀版、今年则是智驾版，比亚迪新年迎来了全车系的更新..

关于作者

朴一生(普通会员)

文章

964

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

DeepSeek 究竟是个啥？一文带你看明白

1个月前

04

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

05

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

标签云

成员 网址收录40400 企业收录2983 印章生成237730 电子证书1054 电子名片60 自媒体54483

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索