> 自媒体 > (AI)人工智能 > 微软开源DeepSpeed Chat,人人上手训练大模型不再是梦
微软开源DeepSpeed Chat,人人上手训练大模型不再是梦
来源:界面新闻
2023-04-14 16:18:52
554
管理

界面新闻记者 | 佘晓晨

界面新闻编辑 |

近日,微软开源DeepSpeed Chat的消息再次引发AI圈的关注。

DeepSpeed Chat基于微软的DeepSpeed深度学习优化库开发而成,具备训练、强化推理等功能,其使用了RLHF(基于人类反馈对语言模型进行强化学习)技术,可以将训练速度提升15倍以上,同时大幅降低成本。根据微软DeepSpeed组的官方介绍,DeepSpeed-Chat具有三大核心功能:简化ChatGPT类型模型的训练和强化推理体验、DeepSpeed-RLHF模块和DeepSpeed-RLHF系统。

在ChatGPT走向大众视野之后,大模型背后的算力和训练成本继而成为焦点。

国金证券测算的数据显示,在通用大模型训练方面,使用云计算时ChatGPT的训练成本约为170万美元,若自建AI算力中心进行模型训练,训练成本有望降至约51万美元;在大模型推理方面,使用云计算时的ChatGPT每处理1000Tokens信息需花费约0.177美分,自建AI算力中心有望将成本降至0.053美分。

今年3月1日,OpenAI宣布开放ChatGPT API接口,允许第三方开发者通过API将ChatGPT功能集成到自己的应用程序和服务中。该接口对每1000字符处理单元收费0.002美元,即支付两美元可处理约75万个英文单词。OpenAI称,新模型较GPT-3.5模型便宜10倍,成本下降主要因为团队去年12月以来进行一系列的系统优化。

此前,开源社区已经推出过LLaMA、Alpaca、Vicuna、Databricks-Dolly等模型,让更多人用上ChatGPT。不过,由于缺乏支持端到端的RLHF规模化系统,类ChatGPT模型的训练依然存在不小的阻碍。

DeepSpeed方面表示,尽管开源社区付出了巨大的努力,但目前仍缺乏一个支持端到端的RLHF规模化系统,这使得训练强大的类ChatGPT模型十分困难。

例如,用现有的系统训练一个适度的6.7B ChatGPT模型,通常需要昂贵的多GPU设置,这是许多数据科学家无法做到的。即使有这样的计算资源,训练效率也往往低于这些机器所能达到的5%。即使有多GPU集群,现有的解决方案也无法做到简单、快速和经济实惠地训练具有数千亿个参数的最先进的ChatGPT模型。

为了让ChatGPT这样的模型更容易被普通数据科学家和研究者使用,并使RLHF训练真正普及到AI社区,他们发布了DeepSpeed-Chat。

而在微软开源DeepSpeed Chat之后,普通用户可以通过简单的操作训练类ChatGPT等大语言模型。数据显示,只需要花费1620美元,就可以通过混合引擎DeepSpeed-HE,在2.1天内训练一个OPT-66B模型;如果使用多节点、多GPU系统,DeepSpeed-HE可以花320美元,在1.25小时内训练一个OPT-13B模型,花费5120美元,在不到一天的时间内训练一个OPT-175B模型。

这也是AI界为之振奋的原因。在微软开源DeepSpeed Chat之后,更多人开始有机会直接上手训练大模型。对于需要更多数据训练的AI行业来说,也将是一次重要的节点。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
看看如何用ChatGPT自动聊天机器人回答问题赚取高额...
如何用ChatGPT自动聊天机器人回答问题赚取高额销售提成?这个智能聊天机..
部长通道|科技部部长谈ChatGPT:对人工智能的研究运用需注意科技伦理..
3月5日上午,第十四届全国人民代表大会一次会议首场“部长通道”采访活动..
我是如何使用ChatGPT和CoPilot作为编码助手的
CSS 生成 (Github Copilot)在构建 Dr Droid 的过程中,我设定了一个自行..
ChatGPT太火,这些人却给它泼冷水
·两位人工智能界的重磅专家,甚至因为都对ChatGPT持反对态度而消解了之..
GPT-3.5和GPT-4.0能否成为下一个文学天才?
嘿,大家好! 今天我们要聊聊人工智能的新宠儿——GPT-3.5和GPT-4.0。 这..
ChatGPT涉嫌侵权?普利策奖得主起诉人工智能公司
据路透社报道,包括普利策小说奖得主迈克尔·夏邦(Michael Chabon)在内..
GPT-4解出难倒陶哲轩奥数题?语言IQ已达152,但空间推理巨差..
编辑:Aeneas 拉燕【新智元导读】近日,一名外国小哥测出,GPT-4语言能力..
国际统计学会候任主席:ChatGPT等大模型非常依赖数据质量,要大家联手..
何旭铭 澎湃新闻记者 周頔 摄近期ChatGPT等人工智能火爆出圈,人工智能需..
ChatGPT陷入安全危机,成也数据伤也数据
图片来源@视觉中国文 | 根新未来,作者 | 陈根就在这两天,一直高歌前进..
关于作者
酷匠(普通会员)
文章
633
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216705 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索