在阿里云上快速跑起来自己本地部署的类chatgpt（llama.cpp)-脚本导航

在阿里云上快速跑起来自己本地部署的类chatgpt（llama.cpp)

来源：安逸远山滔哥

2023-08-23 23:08:18

586

管理

发现AI实在是太火了，看到这个llama有泄露的版本。

想玩一下

在阿里云上租了一个普通服务器玩起来了。实测8C32G的大概200G硬盘的主机就能跑（实际我觉得应该可以更小）

实测开通Ubuntu 22版本非常方便。

CentOS 7.9bug很多，不再建议用了

部署步骤如下：

下载模型。我下载了7B模型脚本

curl -O https://raw.githubusercontent.com/shawwn/llama-dl/56f50b96072f42fb2520b1ad5a1d6ef30351f23c/llama.sh

脚本中修改如下的行

MODEL_SIZE="7B,13B,30B,65B"

为：MODEL_SIZE="7B"

执行下载文件

bash llama.sh

编译和运行llama.cpp

部署步骤如下：

# build this repogit clone https://github.com/ggerganov/llama.cppcd llama.cppmake# obtain the original LLaMA model weights and place them in ./modelsls ./models65B 30B 13B 7B tokenizer_checklist.chk tokenizer.model# install Python dependenciespython3 -m pip install torch numpy sentencepiece# convert the 7B model to ggml FP16 formatpython3 convert-pth-to-ggml.py models/7B/ 1# quantize the model to 4-bits./quantize.sh 7B# run the inference./main -m ./models/7B/ggml-model-q4_0.bin -t 8 -n 128

然后就可以跑起来了

暂时还不支持中文（我考虑后续买个阿里云的机器翻译，中英文翻译一下玩）。感觉llama还是很不靠谱

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

FATE-LLM 新版本发布，支持中文大语言模型 ChatGLM-6B 联邦化训练

2023-08-23 23:09

战国时期实战演习手册《战国策》国学知识点第二篇

2023-08-23 23:06