中国人牛，60亿中文大模型ChatGLM6B也支持AMD显卡和手机了-脚本导航

> 自媒体 > （AI）人工智能 > 中国人牛，60亿中文大模型ChatGLM6B也支持AMD显卡和手机了

中国人牛，60亿中文大模型ChatGLM6B也支持AMD显卡和手机了

来源：安逸远山滔哥

2023-07-18 15:05:49

1026

管理

ChatGLM6B是目前国内使用最多的大模型了。之前必须在英伟达的显卡上跑。

现在支持AMD显卡和手机，中国人厉害

虽然还是比较慢，但是好歹可以跑了。

实测AMD显卡跑的还是比较快的，手机速度目前还惨不忍睹。期待作者继续优化

项目地址

https://github.com/wangzhaode/ChatGLM-MNN

impl

GPU CPU

CPU only

MNN

0.292

0.877

Pytorch

out of memory

1.344

优化过程

该项目将模型ChatGLM-6B转换到MNN并使用C 进行推理。在实现上做了如下优化：

对其中的词表做了部分删减，删除了模型中未使用的前20000个图片词；将vocab, embedding, lm_head的大小从150528缩小到130528;Embedding操作调用次数较少，使用fseek, fread加载的方式降低内存;lm_head操作为[num, 4096] @ [4096, 130528]，转换为[130528, 4096] @ [4096, 1];原模型对显存要求较高；将模型按层拆分成28个模型，可以根据用户显存大小动态将计算任务分配给GPU和CPU，充分利用GPU与CPU内存与算力; 即使小显存显卡也可以加速生成。针对端侧设备可以逐次加载计算，2G内存的Android设备也可以执行推理（速度较慢）。现已提供ONNX导出方法和模型，可以使用其他框架部署；点击下载

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

Google、百度的一些搜索技巧

2023-07-18 15:07

比文字更亲切，比图像更理性，这就是声音的力量

2023-07-18 15:03

相关文章

chatGPT可以写中文吗-用chatGPT写原创文章

chatGPT可以写中文吗ChatGPT可以写中文。在过去的几年中，许多深度学习机..

ChatGPT4.0：为什么美国几乎无恶不作,世界上的盟友还那么多?..

以下是一些解释：1. 利益驱动：对于国家来说，利益往往是最重要的考量。..

ChatGPT是智能助手？搜索引擎？它对于我们日常生活有什么改变？..

ChatGPT用了两个多月的时间达到了1亿规模的月活用户，这使它成为了史上用..

跟别人聊天，很容易无话可说？转变思维，你也能滔滔不绝地聊天..

与人聊天的时候，你会不会遇到以下这个问题：抛出某个话题，大家三言两语..

为裸聊诈骗“养”17万个QQ号，上海警方成功捣毁犯罪团伙..

上海警方近期成功从一起裸聊敲诈勒索案件线索入手，层层深挖，成功捣毁一..

用ChatGPT「指挥」数百个模型，HuggingGPT让专业模型干专业事..

机器之心报道机器之心编辑部ChatGPT 这次成为数百个模型的管理者。几个月..

“人工智能教父”杨立昆：ChatGPT没那么厉害

ChatGPT或GPT4并没有什么令人惊讶或者秘不可宣的地方，除了它们可以公之..

GPT-4变笨加剧，被曝缓存历史回复：一个笑话讲八百遍..

GPT-4模型的缓存回复：真相与疑虑引言在人工智能领域，GPT-4模型引起了广..

史上最强NLP模型不开源惹众怒！马斯克愤然退出OpenAI

策划编辑 | Vincent出处 | AI前线上周，OpenAI 推出的新通用语言模型 GPT..

关于作者

乖乖(普通会员)

文章

586

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

04

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

05

OpenAI突发更新！GPT-3.5正式开放微调，人人可打造专属ChatGPT

2023/08/26

标签云

成员 网址收录40369 企业收录2981 印章生成216706 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索