> 自媒体 > (AI)人工智能 > 比GPT-4还强,20亿参数模型做算术题,准确率几乎100%
比GPT-4还强,20亿参数模型做算术题,准确率几乎100%
来源:机器之心Pro
2023-10-09 20:06:38
433
管理

机器之心报道

编辑:陈萍、小舟

语言模型做数学题,能力又升级了。

当前,大型语言模型 (LLM) 在处理 NLP 领域的各种下游任务方面已经表现出卓越的能力。特别是,GPT-4、ChatGPT 等开创性模型已经接受了大量文本数据的训练,使它们具备强大的文本理解和生成能力,能够生成连贯且上下文相关的响应,在各种 NLP 任务中具有高度通用性。

然而,LLM 在数学推理方面的性能却不尽如人意。LLM 很难准确地执行复杂的算术运算,尤其是涉及超过 8 位数字乘法的运算,还有涉及小数、分数的运算。

基于此,来自清华大学、TAL AI Lab 和智谱 AI 的研究者联合提出了一个能够完美执行复杂算术运算的新模型 ——MathGLM。

本文采用 GLM 的不同变体作为骨干来训练 MathGLM,包括具有 335M 参数的 GLM-large、GLM-6B、GLM2-6B 和 GLM-10B。此外,本文还使用 ChatGLM-6B 和 ChatGLM2-6B 主干网络训练 MathGLM。这些骨干模型赋予 MathGLM 基本的语言理解能力,使其能够有效理解数学应用题中包含的语言信息。

实验

本文设计了两种不同类型的实验,包括算术任务和数学应用题。

对于算术任务,本文预训练了一个基于 Transformer 的 MathGLM 模型,该模型具有 500M 参数,并将其与领先的大型语言模型 (LLM)(例如 GPT-4 和 ChatGPT)的性能进行了比较。结果如表 3 所示, MathGLM 优于所有其他模型,表明 MathGLM 在处理算术任务方面具有卓越的性能。

即使只有 1000 万个参数的 MathGLM-10M,结果也令人惊讶。MathGLM-10M 在一系列综合算术任务中的性能优于 GPT-4 和 ChatGPT。

感兴趣的读者可以阅读论文原文,了解更多研究内容。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
六问ChatGPT:当AI“成精”
如今的ChatGPT,火到几乎什么话题想蹭上它的热度,然而这世上很多事物都..
中国版“ChatGPT”正火速赶来,百度称下月完成内测并开放..
ChatGPT近期不断“刷屏”,中国互联网大厂动向如何?2月7日,记者从百度..
GhatGPT-4.0发布?最强人工智能又升级了?与旧版有何不同?..
尊敬的读者朋友们,随着人工智能技术的飞速发展,语言模型也在不断地迭代..
ChatGPT火遍全世界,苹果却没当一回事?
自OpenAI正式推出ChatGPT聊天机器人引起全球近1亿人争相注册尝试后,不管..
GPT-4 何时可用?
GPT-4 包括大幅增加输入中可以使用的单词数量的能力......高达 25,000 ..
大湾区科学论坛|利用GPT大模型为企业提供“百科全书”..
5月21日,在广州南沙区举行的“智汇湾区 湾和世界”2023年大湾区科学论坛..
孩子在哭,领导催工作,老公在打王者荣耀,我快受不了了..
2015年12月份,一个冬天的晚上,我终于完成了年底工作的绩效材料,装订打..
GPT-4 能力大幅提升,是否会加速许多职业的升级或下岗?..
近年来,人工智能技术的飞速发展已经深刻地改变和影响了我们的社会和经济..
马斯克创办“真相GPT”:一个关心且了解宇宙的AI,不太可能毁灭人类..
马斯克针对AI快速进化多次表达过忧虑的马斯克,决定创办一家新的人工智能..
关于作者
加勒比海盗..(普通会员)
文章
604
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216706 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索