> 自媒体 > (AI)人工智能 > FATE-LLM 新版本发布,支持中文大语言模型 ChatGLM-6B 联邦化训练
FATE-LLM 新版本发布,支持中文大语言模型 ChatGLM-6B 联邦化训练
来源:InfoQ
2023-08-23 23:09:40
275
管理

作者 | 李冬梅

当前,AI 大模型已成为科技创新和数字经济领域的热点,其高速进程中面临的诸多问题也引发了业内关注。FATE 开源社区技术指导委员会主席杨强教授指出:“即将消耗殆尽的公域数据,日趋高涨的隐私安全保护需求,以及众多异构小模型的整合需求,已成为 AI 大模型发展之路上亟待突破的瓶颈。而联邦大模型正是解决这些问题的有效路径。”在此背景下,FATE 社区开源了 FATE-LLM 联邦大模型功能模块,以联邦学习 大模型的技术解决方案破局数据隐私保护与数据不足等问题,以应对行业发展的新挑战。

近期,联邦大模型开源平台 FATE-LLM 最新版发布,在横向联邦场景支持 ChatGLM-6B 中文语言大模型。集成 GLM 的 FATE-LLM 将会为国内用户提供更好的中文大模型应用落地选择。

GLM 系列大模型由清华大学和智谱 AI 联合研发,其中 ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,并针对中文进行了优化。该模型基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。开源两个月以来,ChatGLM-6B 在全球最大开源软件平台 GitHub 上获得超过 26 万星,超过斯坦福同期模型的关注度和好评度,全球下载量超过 200 万,并连续两周登上全球最大开源大模型平台 Hugging Face 大模型趋势榜榜首。

此次更新的 FATE-LLM v1.1 版本在横向联邦场景支持 Adapter,Prompt 这类高效聚合方法,可以显著提升联邦大模型训练效率,其中参数微调方法支持 Lora 以及 P-Tuning V2 。而在框架层,FATE 实现对 DeepSpeed 的集成,使得 FATE-LLM 支持多机多卡训练,支持分布式 GPU 集群资源调度和管理,支持数据、模型参数等不同并行化加速方法。用户只需要任务提交阶段直接增加配置即可享受到多机多卡的加速能力。

项目链接:https://github.com/FederatedAI/FATE-LLM/releases/tag/v1.1.0

FATE-LLM v1.1 功能介绍亮点概述

1)集成业界开源的主流中文语言大模型 ChatGLM-6B,支持高效的参数微调机制 Lora、P-Tuning V2 等方法,提升联邦训练的通信效率和训练效率;

2)FATE 实现对 DeepSpeed 框架集成,使得 FATE 具备多机多卡联邦大模型加速训练能力:支持分布式 GPU 集群资源调度和管理;支持数据、模型参数等不同并行化加速方法。

功能一览

1)ChatGLM-6B 联邦化支持,并支持 LoRa、P-Tuning V2 高效微调方案;

2)FATE 多机多卡联邦大模型训练能力支持,在任务提交阶段增加相关配置即可使用数据、模型等不同阶段的训练加速能力,与用户模型训练代码解耦;

3)FATE 支持分布式 GPU 集群资源管理功能;

4)支持使用 transformers 库的 data collator 类,可以更灵活地处理训练输入数据;

5)支持只保存可训练参数,降低训练阶段 checkpoints 保存的硬盘占用,方便模型拷贝使用。

实验数据

1)高效参数微调机制的参数量及其训练参数占比

2)场景及数据、以及配置

联邦场景:横向联邦,两个参与;应用场景:两个参与方各持有部分数据,数据格式:,希望模型可以根据输入的广告关键字去自动生成广告宣传语,通过联邦建模去提升广告生成词的效果。

下面给出效果示例:

清华大学教授唐杰表示:“作为科研人员,我们希望在开展大模型技术研究与应用落地的同时,也进一步降低人工智能的使用门槛,实现技术普惠,为行业良性发展做出一些贡献。”

饮其流者怀其源。开源不仅是一种技术选择,更是一种分享态度与沟通方式。开源平台和开源生态将助推大模型的快速迭代与落地应用。

本文转载来源:

https://www.infoq.cn/article/8zfeEZcsDD7JSBLZYg6j

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
浙江某大学女生感情混乱1V5,40分钟不雅录音曝光,内容不堪入耳..
前段时间网络上疯传着一段爆料,说在浙江杭州的一位女大学生谈恋爱出轨,..
ChatGPT考高三物理得零分,网友:偏科太严重,快让它补补课..
ChatGPT可以帮助人们节约很多时间,但是解决实际问题还是要靠人类自己。..
谷歌版ChatGPT支持中文了!弱智吧实测结果在此
克雷西 发自 凹非寺量子位 | 公众号 QbitAIClaude 2发布之后,Google也按..
ChatGPT应用技巧二:如何让ChatGPT写长文
#AI #ChatGPT #提示工程在使用免费版的ChatGPT过程中,如果我们想要针对..
让ChatGPT4.0来告诉你,选择德国朗适新风系统的优势
德国朗适新风系统是具有通风、热回收和净化功能的节能环保型产品。它通过..
ChatGPT红遍全球,国内积极探索打造落地应用,未来,与AI聊聊唐诗国画..
提问:为什么年轻人要关注新兴事物?ChatGPT:关注新兴事物可以帮助年轻..
ChatGPT火爆出圈!“Chat”是“聊天”,但你知道GPT是什么意思吗..
ChatGPT无疑是2023年开年爆款话题!5天注册用户超100万,月活破亿用时仅2..
ChatGPT在PubMed上的发表数量超过1000篇:展望未来之路
2023年9月6日发表在Cureus杂志上,作者是两位来自美国的医学教授,分别是..
“AI换脸”背后的生意经:超百部“明星、网红换脸”色情视频仅售几十元..
央广网北京7月10日消息(记者刘经宇)7月3日,一名拥有670余万粉丝的网红女..
关于作者
无根草(普通会员)
文章
347
关注
0
粉丝
2
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成186841 电子证书796 电子名片49 自媒体20953

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索