> 自媒体 > (AI)人工智能 > ChatGPT成功背后的网络功臣,全栈智能网络技术揭秘
ChatGPT成功背后的网络功臣,全栈智能网络技术揭秘
来源:智东西
2023-05-06 14:15:54
403
管理

智东西

作者 | ZeR0

编辑 | 漠影

智东西4月17日报道,随着大语言模型研究日渐火热,庞大的参数规模带动计算量一路飙涨,对网络带宽提出更高要求。加速大语言模型训练和推理背后的网络基础设施也日益受到关注。

突破网络通信限制,不仅有助于提高大模型计算性能和效率,也有助于降低能耗和电力成本。近日,NVIDIA网络技术专家崔岩、NVIDIA网络市场总监孟庆与智东西等媒体进行深入交流,分享其全栈智能网络技术如何为大模型提供支撑。

孟庆谈道,在AI快速发展的过程中,后进入市场的参与者如果想要赶超已进入市场的参与者,有两种方式,一是按照已成功的范例来投入资源,二是投入同样的资源但要跑得更快,跑得更快必然需要提高效率,而提高效率就需要DPU。

OpenAI便是采用DPU节约时间成本的一大例证。微软前段时间发布的博客文章明确写道,OpenAI采用的硬件包括NVIDIA BlueField-2 DPU及其智能网卡InfiniBand 200G网络。这个被实践检验过的样本已经被很多公司参考。

一、用于两套高性能网络平台,BlueField-3 DPU今年开始大规模投放

面向全新应用,NVIDIA提供两套高性能网络平台,分别是Quantum-2 InfiniBand网络平台和Spectrum-4以太网网络平台,都是端到端400G高带宽高性能网络架构。BlueField-3 DPU是这两大网络平台里的共有组件,同时用到InfiniBand网络和以太网网络。

例如,国内知名云计算服务商UCloud(优刻得)采用DPU应用于其裸金属服务器租用,它可以将资源分配的软件跑在DPU上,这样客户能够100%租这台机器的计算资源、内存资源,没有隐形消耗(数据中心税)。

DOCA 2.0伴随着BlueField-3 DPU正式发布。NVIDIA BlueField-3 DPU提供了三种异构的可编程引擎,包括Arm、加速可编程管道线和数据路径加速器(DPA),用DOCA的软件框架把它统一起来。因此开发者不用在意底层异构硬件的如何实现。

比如BlueField-2 DPU上的智能网卡芯片用的是ConnectX-6,而BlueField-3 DPU用的是ConnectX-7。在ConnectX-7上实现的程序编程,可以无缝直接应用在BlueField-3 DPU上,调用同样的核心代码而无需更改。

此外,DOCA 2.0新增了对数据路径加速器(DPA)的编程功能,DPA是采用RISC-V架构的处理器,主要用来加速网络流量和处理数据包。

总得来看,DOCA 2.0有几个新的重要功能:

1、统一的软件框架。同时支持上一代DPU和最新的BlueField-3 DPU,新增DPA等功能。

2、软件生态变得丰富。很多软硬件合作伙伴都兼容并支持新一代DPU,包括Oracle OCI的云基础设施、微软Azure等。

DPA有几大特性:1、BlueField-3 DPU中引入了DPA计算子系统;2、DPA针对设备仿真、IO密集型应用、高插入率、网络流处理、客户协议、集体和DMA操作进行了优化;3、通过DOCA FlexIO SDK、DOCA DPA SDK、支持这些SDK的工具链和示例及宣传资料等方式实现客户可编程性;4、提供利用DPA开发的交钥匙应用程序。

DOCA 2.0 FLOW库是对开发者非常有用的特性,可以把对数据包处理的方式抽象出来,之后调用时,不管是做软件定义网络、网关还是做几百万次查询插入式操作,都非常有意义。

库就像是一个字典,调用时不用管具体操作是怎么完成的,对开发者来说,用简单方式就能实现这么多的功能,所以它可以快速写代码、部署,缩短业务上线时间。其目标网络应用有路由器、下一代防火器(NGFW)、负载均衡器(Load Balancer)、用户平面功能(UPF)等,都是基于NVIDIA提供的DOCA FLOW通道。

Regex是处理网络流量的重要算法,是数学里正则表达式的计算。NVIDIA在BlueField-3 DPU中改进了Regex硬件引擎。通过增强综合性能,新增的双向搜索能力可以让它更快找到匹配项,从而提高规则性能,并能够编译比BF2目前支持的更多规则。这对于网络海量并发时非常重要。

DOCA 2.0还为BlueField-3 DPU带来了新的SNAP基础设施SNAP v4。很多AI企业有上百TB的数据集,做远程调用会非常看重这个核心。用DPU卸载SNAP v4的功能可以释放带宽和调用时间,大幅提升效率。NVIDIA之后会将SNAP v4放在公共NGC上发布,也是一键部署。

DOCA 2.0 BlueMan是一款易部署的遥测可视化工具。管理员可以通过它提供的图形界面去查看自己所有的主机情况,包括健康、性能、网络流量是否存在问题以及风险预警等。

四、56%的DOCA开发者来自中国社区

目前NVIDIA DOCA开发者社区提供相关DOCA API文档及资源,从而指导开发者怎么基于BlueField系列DPU进行部署和编程。

其全球开发者已经超过4700人。DOCA中国社区是2021年7月份发布的,2021年末时中国占了全球开发者42%,到2023年1月已经有56%的开发者来自中国社区。这些来自中国的开发者,有的来自互联网大厂、有的来自创业公司,也有的来自高校。

NVIDIA在推进DOCA中国社区发展时考虑到一个问题,基于BlueField系列DPU的DOCA 软件开发与基于GPU的CUDA开发不一样,开发者可以采用笔记本电脑或台式机就可以搭建GPU开发环境,但开发者自己搭建DPU开发环境是不太容易的事情。

为此,NVIDIA授权设立了DPU & DOCA卓越中心,与三家合作伙伴(丽台、信弘、联泰集群)一起,向中国开发者提供免费的DOCA开发环境。

DOCA开发者需要成功注册NVIDIA DOCA开发者体验计划,才能申请免费开发环境。申请人需要提前48小时以个人名义通过向NVIDIA授权合作伙伴发送申请,提交申请的详细信息,且信息准确无误,获得授权合作伙伴审核批准后可获得2小时-6小时免费的DOCA开发环境。

结语:加速大模型普及需要更好的网络基础设施

无论是愈发热门的大模型,还是已经走向落地普及的传统中小型模型,都需要更好的网络基础设施来突破吞吐量和性能瓶颈。

就像人们在日常生活中永远不会嫌网络太快,数据中心的效率提升也永无止境。将数据效率提升,就意味着租用面积变少、动用的空调等设备变少、消耗的电力变少,或者用同样电能时执行计算任务的效率大大提高。

如NVIDIA创始人兼CEO黄仁勋所言,AI正迎来“iPhone时刻”,在更强大的计算基础设施与网络基础设施配合下,生成式AI能力将逐渐深入各行各业,慢慢改变很多工作、生产和生活的方式。

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
一招高情商聊天技巧,让对方滔滔不绝!#聊天技巧
以下是一种聊天技巧,让别人畅所欲言。只要你和大老板在一起不会聊天,以..
用清白诬陷老板“骚扰”,千万网红账号被封,谋划群聊天记录曝光..
#头条创作挑战赛#自媒体时代,人人都可以成为大网红,这给了广大普罗大众..
华人团队迷你GPT4抢跑看图聊天:OpenAI有的它都有,服务器被挤爆..
梦晨 发自 凹非寺量子位 | 公众号 QbitAIGPT-4识图功能迟迟不开放,终于..
想要改变一切的 OpenAI,正在被改变
OpenAI的演变与愿景在科技界,OpenAI一直以来都是备受瞩目的存在。这个公..
GPT-3的50种玩法告诉你,它很酷,但是没有通过图灵测试..
3、扩充表中的信息界面设计还算简单,GPT-3还能帮你做人口普查。这个应用..
GPT-4的最大进步是同时解析文本和图像,但它可能没那么“震撼”..
界面新闻记者 | 李京亚界面新闻编辑 | 历经几个月的传言和猜测,OpenAI以..
今天,GPT-4登陆Office全家桶,打工人的生产方式被颠覆了..
机器之心报道机器之心编辑部未来和 AI 一起工作是这样的。「用人工智能重..
OpenAI是一家什么样的企业——OpenAI介绍与成果总结
OpenAI是全球最著名的人工智能研究机构,发布了许多著名的人工智能技术和..
OpenAI不藏着了,开放微调功能,不用其他工具就能搞一个你自己的ChatGPT..
8月23日,OpenAI宣布推出基于GPT-3.5 Turbo的微调功能并更新API,让企业..
关于作者
黑暗森林(普通会员)
文章
356
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成186789 电子证书796 电子名片49 自媒体20815

@2022 All Rights Reserved 浙ICP备19035174号-7
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索