编辑:yaxin, 好困
【新智元导读】1750亿参数,GPT-3靠的不仅是算法的提升,还有「算力的加成」。最新MLPerf基准测试中,昇腾基础软硬件平台集群性能同比提升2.4倍!如何释放「算力狂魔」?还要看CANN这三个黑科技。未来十年,是AI算力的「超摩尔时代」。
要说2020年,AI领域最火的是什么?
毫无疑问是GPT-3,它能写小说、能与人聊天、还能下象棋...... 曾被冠以最「全能」语言模型的称号。
就在6月30日,国际权威AI基准测试MLPerf公布最新一期榜单。
国外,英伟达、谷歌等「算力」大厂的表现,可谓是赚足了眼球。
在国内,鹏城实验室和北京大学联合团队基于华为昇腾AI基础软硬件平台,在MLPerf基准测试中同样取得优异的表现。
测试结果显示,昇腾基础软硬件平台集群性能同比提升2.4倍!
千P「云脑」再进化:给AI硬件插上翅膀AI计算基准评测组织MLPerf成立于2018年5月,由图灵奖得主大卫·帕特森(David Patterson)发起,学术界和工业界联合制定和推广。
它囊括了AI行业中的70多个知名企业和机构,会员包括华为、谷歌、英特尔、英伟达、微软、脸书等,目的是提供AI软硬件系统的通用Benchmark评测基准。
MLPerf是当今权威性最大、影响力最广的国际AI性能基准测试,相当于AI技术领域的「晴雨表」。
MLPerf Training测试中,鹏城实验室基于华为昇腾AI基础软硬件平台鹏城云脑II,实现了同比性能大幅增长。
该平台是唯一拥有自主知识产权的全栈系统,成绩稳居世界第一阵营。
从MLPerf1.0的评测结果可以看出,在昇腾硬件基本不变的情况下,通过软件和系统级优化,
「Resnet50单卡训练的性能」,在一年的时间内提高了82%。
再看,「Resnet50集群训练的性能」在一年的时间内提高了240%,时间开销仅为0.65min。
先说硬件实力。
硬件便是我们熟知的鹏城实验室与华为共建鹏城云脑Ⅱ。
采用搭载鲲鹏、昇腾处理器的Atlas 900集群,算力为1000P(每秒百亿亿次计算)。
CANN 3.0现在的架构功能十分完善,对外提供适配不同硬件、不同 OS 的驱动,支持NPU CPU异构通信。
对内可实现Stream、内存等底层管理,丰富的加速库支持算子/标量/向量等通用计算,能高效完成图像和视频数据的预处理,执行引擎为深度神经网络计算提供了执行上的保障。
CANN为用户提供可以快速构建AI应用和业务的多层次编程接口有:
1、统一的编程语言:提供一套标准的ACL编程接口,为开发者屏蔽底层处理器的差异,提升用户APP编程易用性;
2、统一的网络构图接口:提供标准的昇腾计算AIR,支持多框架,让用户可以快速部署神经网络业务;
3、高性能计算引擎以及算子库:通过高性能编译引擎、执行引擎、调优引擎和预置高性能算子库,支撑用户快速部署神经网络业务、降低部署成本并最大程度发挥昇腾计算能力;
4、基础服务:驱动、虚拟化、媒体、集合通信等能力。
在这次MLPerf评测中,对于鹏城实验室优异性能的表现,鹏城实验室MLPerf评测负责人徐鹏翔老师,为我们首次曝光了本次评测所使用CANN的三个黑科技:
1、算子融合性能优化
2、多流水快速启动提升有效算力
3、集群系统性能优化方案
接下来,带你一睹为快。
三个AI黑科技黑科技一:算子融合性能优化
如何理解算子融合性能优化?
通俗来讲就好比做菜,数据好比食材,算子好比制作工序。
普通厨师需要6道工序才能做出佳肴,而优秀厨师将这6道工序「浓缩」成3道,能够有效提升制作效率。
那么,如何进行工序有效融合将考验厨师的技艺。
三个黑科技,让CANN打开了算力魔盒,为AI硬件插上了翅膀。
华为轮值董事长胡厚崑在2021世界人工智能大会开幕式曾表示,「只有基础打得牢,根技术扎得深,应用创新跑得快,才有人工智能产业的参天大树和生态的持续繁荣。」
鹏城实验室能够在最新MLPerf基准测试中实现2.4倍性能提升,正是因为异构计算架构CANN这3个黑科技扎下了深根。
只有基础打得牢,根技术扎得深,才有人工智能的繁荣发展。
总之,技术要扎到根,根深才能叶茂。
—完—
欢迎点赞~ 关注 新智元 及时了解人工智能新动态~
相关文章
猜你喜欢
成员 网址收录40400 企业收录2981 印章生成237600 电子证书1052 电子名片60 自媒体51698