> 自媒体 > (AI)人工智能 > 速度快10倍,成本降一个数量级!英伟达发布ChatGPT专用GPU
速度快10倍,成本降一个数量级!英伟达发布ChatGPT专用GPU
来源:澎湃新闻
2023-04-12 12:18:58
372
管理

00:59

澎湃新闻编辑 李垚瑞(00:59)

“AI的iPhone时刻已经到来。”

北京时间3月21日晚,图形芯片巨头英伟达(Nvidia)召开2023年GTC大会,其创始人兼CEO黄仁勋穿着标志性皮夹克发表主题演讲,介绍了英伟达在人工智能(AI)领域的多款产品,包括为大型语言模型设计的新款GPU(图形处理器)、针对AI(人工智能)视频的芯片L4,以及AI超级计算服务DGX Cloud等。

在演讲中,黄仁勋多次重复道,AI的iPhone时刻已经到来,并表示“生成式AI将重塑几乎所有行业”。

“生成式AI让企业产生重新思考其产品设计、商业模式,大家都希望成为推动变革的一方,而不是被变革淘汰的一方。”黄仁勋说道。

3月21日美股收盘,英伟达涨1.15%,报收261.99美元/股,盘后微跌0.09%,相比英伟达股价的波澜不惊,22日上午,A股ChatGPT、算力、CPO、芯片、电商题材活跃,截至午盘,寒武纪(688256)涨超10%,工业富联(601138)涨超8%,青云科技(688316)涨停。

H100 NVL:速度快10倍,成本降低一个数量级

去年11月,OpenAI推出基于大型语言模型(LLM)的聊天机器人ChatGPT,这一技术引发各界关注,随后微软、谷歌等科技公司在AI领域展开角逐。

在演讲中,黄仁勋也着重介绍了英伟达在这一领域的布局,透露道针对算力需求巨大的大型语言模型(LLM),英伟达推出新款GPU——NVIDIA H100 NVL。

H100基于英伟达的Hopper架构,采用Transformer引擎。其具有94GB内存,并配备了双GPU NVLINK的PCIE H100 GPU,能处理含1750亿参数的GPT-3。

与用于处理ChatGPT的HGX A100相比,搭载四对H100和双NVLINK的标准服务器的处理速度最高可达10倍。黄仁勋称,它能将大语言模型的处理成本降低一个数量级。

“加速计算并非易事。”黄仁勋举例,2012年计算机视觉模型AlexNet动用了GeForce GTX 580,每秒可处理262 PetaFLOPS,该模型引发了AI技术的爆炸。而十年之后,随着Transformer的出现,GPT-3动用323 ZettaFLOPS的算力,是AlexNet的100万倍。

来源:英伟达

此外,针对AI视频英伟达还推出了芯片L4,在视频解码和转码、视频内容审核、视频通话等功能上进行优化。英伟达称,相比传统的CPU,L4能够提供高出120倍的AI视频性能,同时能效提高99%。

在芯片制造工艺方面,英伟达还宣布推出计算光刻库cuLitho,并与ASML、台积电等巨头展开合作。据介绍,cuLitho可将计算光刻加速40倍以上,使2nm及更先进芯片的生产成为可能。

“计算光刻是芯片设计和制造领域中最大的计算工作负载,每年需要消耗数百亿CPU小时。”黄仁勋说道,该软件正被集成到全球最大的代工芯片制造商台积电的设计系统中,台积电将于6月开始对cuLitho进行生产资格认证。

DGX Cloud:每月3.7万美元,让任何企业都能构建AI能力

在主题演讲中,黄仁勋还介绍了英伟达在生成式AI方面的另一个布局——AI超级计算服务DGX Cloud。

黄仁勋透露,英伟达已经与多家云服务供应商合作,推出云端人工智能DGX Cloud,未来企业可以按月租、通过浏览器使用DGX Cloud集群,快速轻松地扩展大型多节点AI训练。DGX Cloud起价为每个实例每月36999美元。

“这种合作关系将英伟达的生态系统带到云服务商手中,还扩大了英伟达的市场规模和覆盖面。”黄仁勋说道。

据介绍,每个DGX Cloud实例具有八个H100或A100 80GB Tensor Core GPU,每个节点共有640GB GPU内存。NVIDIA Networkin 构建的高性能、低延迟结构确保工作负载可以跨互连系统集群扩展,允许多个实例充当巨大的GPU,以满足高级AI训练的性能要求。

目前英伟达已经与甲骨文展开合作,预计微软Azure在下个季度将会开始托管DGX Cloud,未来谷歌云也将加入托管行列。

值得注意的是,早在2016年,黄仁勋便向OpenAI交付了第一台NVIDIA DGX超级计算机。黄仁勋透露,目前DGX已经被企业广泛用于优化数据和处理 AI,《财富》100强企业中有一半安装了DGX。黄仁勋称,DGX是超级计算机是现代AI工厂。

对于英伟达带来的产品,金融机构Rosenblatt Securities的半导体分析师Hans Mosesmann表示,这些产品“比竞争对手领先很多年。”该分析师认为,“英伟达在AI软件方面的领导地位不仅具有里程碑意义,而且还在加速发展。”

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
“打爆”一切AI的ChatGPT,为何当不了智能客服?
过去两周,由 OpenAI 推出的 ChatGPT 在全球互联网爆火。ChatGPT 是一款..
我问了Chat GPT这样一个问题,机器的回答让我非常我震惊..
辞职回家快两个月了,在此期间,除了重新更换了租房忙于搬家和回了两趟老..
教你恢复微信聊天记录的方法,不管用啥手机,一查一个准,太棒了..
教你两招立马恢复删除的微信聊天记录,不管你使用的是啥手机都可以恢复,..
二手交易平台乱象调查:网络欺诈真假混卖层出不穷
“原本只想出手两张礼品卡,没想到却摊上了一件糟心事!”近日,北京居民..
实测AI神器ChatHub,让你一键接入ChatGPT和Claude多款聊天机器人..
昨天@AI导航员 测试了一个AI神器,ChatHub,太好用了。先看张图:不得不..
专家谈ChatGPT:应用前景广阔,但经常“一本正经地胡说”..
来源:【海报新闻】大众网·海报新闻记者 吴军林 解强民 济南报道这段时..
微软Copilot“大脑”将升至GPT-4 Turbo,并提高字符上限
IT之家 11 月 28 日消息,Mikhail Parakhin 近期在 X(推特)平台发布推..
识别ChatGPT造假,效果超越OpenAI:北大、华为的AI生成检测器来了..
机器之心专栏机器之心编辑部AI 造假的成功率很高,前几天「10 分钟骗 430..
Google 版 ChatGPT「翻车」,中国公司纷纷跟进,它们急什么?..
ChatGPT 在去年年末推出之后,其热度便不断爬升,甚至成为历史上“用户数..
关于作者
加勒比海盗..(普通会员)
文章
604
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216706 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索