> 自媒体 > (AI)人工智能 > 比GPT-4还强,20亿参数模型做算术题,准确率几乎100%
比GPT-4还强,20亿参数模型做算术题,准确率几乎100%
来源:机器之心Pro
2023-10-09 20:06:38
339
管理

机器之心报道

编辑:陈萍、小舟

语言模型做数学题,能力又升级了。

当前,大型语言模型 (LLM) 在处理 NLP 领域的各种下游任务方面已经表现出卓越的能力。特别是,GPT-4、ChatGPT 等开创性模型已经接受了大量文本数据的训练,使它们具备强大的文本理解和生成能力,能够生成连贯且上下文相关的响应,在各种 NLP 任务中具有高度通用性。

然而,LLM 在数学推理方面的性能却不尽如人意。LLM 很难准确地执行复杂的算术运算,尤其是涉及超过 8 位数字乘法的运算,还有涉及小数、分数的运算。

基于此,来自清华大学、TAL AI Lab 和智谱 AI 的研究者联合提出了一个能够完美执行复杂算术运算的新模型 ——MathGLM。

本文采用 GLM 的不同变体作为骨干来训练 MathGLM,包括具有 335M 参数的 GLM-large、GLM-6B、GLM2-6B 和 GLM-10B。此外,本文还使用 ChatGLM-6B 和 ChatGLM2-6B 主干网络训练 MathGLM。这些骨干模型赋予 MathGLM 基本的语言理解能力,使其能够有效理解数学应用题中包含的语言信息。

实验

本文设计了两种不同类型的实验,包括算术任务和数学应用题。

对于算术任务,本文预训练了一个基于 Transformer 的 MathGLM 模型,该模型具有 500M 参数,并将其与领先的大型语言模型 (LLM)(例如 GPT-4 和 ChatGPT)的性能进行了比较。结果如表 3 所示, MathGLM 优于所有其他模型,表明 MathGLM 在处理算术任务方面具有卓越的性能。

即使只有 1000 万个参数的 MathGLM-10M,结果也令人惊讶。MathGLM-10M 在一系列综合算术任务中的性能优于 GPT-4 和 ChatGPT。

感兴趣的读者可以阅读论文原文,了解更多研究内容。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
超市老板娘出轨小鲜肉,两人聊天记录被曝光,内容既露骨又搞笑..
亲,原创不易,麻烦动动你的小手、点赞,转发,评论一下,谢谢^-^对于这..
ChatGPT VS 讯飞星火——中文信息处理谁赢?
前面我们对外研版必修二Coast to Coast这篇英文课文让ChatGPT和讯飞星火..
你的AI通行证:ChatGPT实战运用训练营,创新商业之路从此开启!..
打破常规,引领未来:ChatGPT实战训练营惊艳首发!2023年6月2日,时代华..
从新奇好玩到实用工具,ChatGPT之后,谁是下一个效率神器?..
在一个寂静的晚上,我坐在书桌前,思考着人工智能的发展与影响。刚过去的..
悲喜两重天:ChatGPT火出天际,幕后开发公司却亏惨了?..
作者:Hernanderz 监制:罗超2023年最热风口是哪个?ChatGPT、大模型认第..
CHAT有那么神秘吗?
最近网上炸开锅的莫过于CHAT了。 美国的科技确实在很多方面领先世界,CH..
意大利禁用ChatGPT,反AI同盟已集结?
财联社3月最后一天,意大利数据保护局(Garante)宣布,即日起暂时禁止使..
chatgpt是个啥?chatgpt中文在线怎么使用?
先看给大家聊聊chatgpt是个啥?先看看chatGPT是如何介绍自己的!ChatGPT..
全球科技早报|ChatGPT版微型手机来了!AI Pin起售699美元;媒体称英伟达将..
每经记者:文巧 每经编辑:兰素英2023年11月10日 星期五1、ChatGPT版微型..
关于作者
加勒比海盗..(普通会员)
文章
453
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40334 企业收录2981 印章生成192878 电子证书830 电子名片52 自媒体25496

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索