> 自媒体 > (AI)人工智能 > 国内大模型在局部能力上,已超ChatGPT
国内大模型在局部能力上,已超ChatGPT
来源:人人都是产品经理
2023-08-09 17:04:21
291
管理

AI浪潮已经席卷国内外,在国内,许多厂商或互联网大厂更是争相布局大模型。那么时间到了现在,国内大模型的产品能力是否有所突破?在这篇文章里,作者就对中文大模型的发展进行了解读,一起来看看吧。

从另一个角度说,C-Eval是一个对大模型从人文到社科到理工多个大类的综合知识能力进行测评的竞赛。通常,高阶难度测试是考验大模型性能的关键动作,面对复杂且有挑战性的任务,大多大模型性能会大幅下降。在C-Eval公布的评比结果中,APUS的AiLMe-100Bv1除了在平均分上进入四强,还在难题处理方面超越GPT-4*,排名第一。

据悉,C-Eval Hard(难题)类别是首个提供中文复杂推理能力的测试,“即便是GPT-4来做这个题也会很吃力,”张旭提及,“这是‘闭卷考试’,而以往如AGIEval和MMLU是‘开卷考试’,也就是说,AGIEval和MMLU是各公司自己测试、自己打分、自己公布成绩,而C-Eval Hard的评比显然更加客观、可信。”

的确,C-Eval测评难度比其他测评更高且更严格。在打分流程上,C-Eval更像是学校中为学生准备的大考模式,各个公司参加统一考试并由系统自动打分、C-Eval团队人工审核成绩并公布,所以,就结果上看,其测评所公布的成绩真实性更高。

三、国内大模型的未来

放眼行业,大模型对于国内人工智能产业的意义非凡。

在NLP行业出现范式变革后,Transformer为主导的新一代通用大模型产品大行其道,让人们看到了AGI的曙光。甚至可以说,中国版的ChatGPT3.5/4.0的问世是我国正式迈向人工智能时代的重要标志。

在过去,一、二级资本市场对国内大模型产业意见颇多。讨论最多的是,国内公司没有在前沿技术投入太多,反而将精力侧重于“蹭”数字人、AIGC等概念之上。

客观地说,上述评价不无道理,其中不乏因大环境不好,企业对前沿投入审慎和相关技术积累薄弱等问题所导致。

但近期,随着对大模型行业认识的深入,以上问题正在得到改变:首先,以智源研究院、百度文心一言、商汤和APUS等企业的持续投入,我国已有多家企业具备大模型制作和运营能力(此前大多为小模型);其次,随着上半年密集的模型发布大会逐渐落幕,新模型开始迭代积累,并向着ChatGPT能力靠拢。

在我们所知的大模型产业上下游企业中,针对数据处理、清洗、标注、模型训练、推理加速等方面的技术也正在加速追赶之中;最后,政策层面已注意到发展大模型和ChatGPT的必要性,开始着手调集更多资源应对,相关生态和创新土壤也正在完备的过程中。

可以肯定的是,本次人工智能革命的核心就是通用大模型。目前,我国众多企业正在加速追赶。

现在,超越ChatGPT已成为国内AI从业者们心中的图腾。想必若假以时日,这个目标将有机会实现。而到那时,一个属于人工智能时代的大幕才彻底拉开。

作者:苑晶,编辑:大兔;公众号:数科星球(ID:digital-planet)

本文由 @数科星球 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
账号下架、微信号改名后,仍有更隐蔽的“掘金者”!律师称盗版ChatGPT触碰..
每经记者:文巧 郑雨航 每经编辑:兰素英随着ChatGPT成为火爆全球的现象..
聊天机器人新鲜劲过了?6月ChatGPT访问量环比下滑近10%,排名第二的Charact..
每经记者:李孟林 每经编辑:高涵推出后便一飞冲天的ChatGPT访问量似乎已..
用好ChatGPT还能搞钱,妈妈再也不用担心我没钱了!
ChatGPT是一种基于人工智能技术的聊天机器人,它使用了自然语言处理技术..
百度发布文心大模型4.0,李彦宏:综合水平与GPT4相比已经毫不逊色..
在百度世界上,李彦宏发布了中国首个生成式商业智能产品——百度GBI,并..
ChatGPT技术探索18:一文说清什么是提示工程
提示工程(Prompt Engineering)是一种针对预训练语言模型(如ChatGPT)..
【比特熊充电栈】Azure OpenAI 守护大模型数据与安全!
随着智能化的深入发展,大模型的时代已经到来。现在,大模型如雨后春笋般..
ChatGPT联网功能回归,OpenAI最新估值将超800亿美元
北京时间9月28日凌晨,OpenAI通过社交平台宣布,ChatGPT联网功能回归,将..
改变格局?Meta与微软合作发布开源模型可免费商用,威胁OpenAI..
·Meta发布其最新开源人工智能模型Llama 2,可免费用于研究和商业用途。..
意大利暂时禁用ChatGPT聊天机器人,将调查其隐私保护问题..
IT之家 4 月 2 日消息,据意大利安莎社报道,意大利已成为第一个禁用聊天..
关于作者
司机(普通会员)
文章
518
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40335 企业收录2981 印章生成193898 电子证书831 电子名片53 自媒体26178

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索