llama2是大型语言模型,它在英文领域的表现非常突出,可以说是目前性能最强的语言模型之一。使用了最新的transformer架构。在多项自然语言处理任务上的测试中,llama2的表现远超其他模型,其生成的英文文本流畅自然,逻辑清晰。
尤其是在长文本生成方面,llama2表现卓越。它可以生成长达数万字的文章,内容连贯、主题明确,几乎达到了可以乱真的专业水准。在诸如新闻写作、故事创作等方面,llama2都展现了强大的语言生成能力,可以说是目前效果最好的预训练语言模型之一。
但是llama2的中文方面惨不忍睹。但从用户的使用 Feedback 来看,llama2的中文生成还存在一些语法错误、语意不通顺的问题。与其在英文领域的出色表现相比,llama2的中文水平还比较初级。
但是在7月21日,就有团队提供了最新的中文模型,而且提供了4bit和7B的模型。
社区项目地址:https://github.com/LinkSoul-AI/Chinese-Llama-2-7b
模型地址:https://huggingface.co/LinkSoul/Chinese-Llama-2-7b
亲身体验,比LLama和LLama2强太多了。
但是7B整体体验还是不如ChatGLM2-6B。期待进一步的发展
体验方式:直接用text-generation-webui便可使用
A10显卡下的性能如下:Output generated in 13.19 seconds (15.09 tokens/s, 199 tokens, context 68, seed 237219055)
Output generated in 5.93 seconds (18.73 tokens/s, 111 tokens, context 37, seed 261033577)
Output generated in 1.29 seconds (17.09 tokens/s, 22 tokens, context 42, seed 1969447505)
Output generated in 1.59 seconds (17.65 tokens/s, 28 tokens, context 56, seed 44848330)
Output generated in 1.13 seconds (16.88 tokens/s, 19 tokens, context 46, seed 1030639221)
Output generated in 0.38 seconds (5.20 tokens/s, 2 tokens, context 40, seed 1890947875)
Output generated in 0.37 seconds (5.36 tokens/s, 2 tokens, context 40, seed 117774792)
Output generated in 7.43 seconds (18.17 tokens/s, 135 tokens, context 40, seed 205588594)
Output generated in 2.02 seconds (13.36 tokens/s, 27 tokens, context 128, seed 1141610546)
Output generated in 72.97 seconds (7.43 tokens/s, 542 tokens, context 128, seed 1186399684)
相关文章
猜你喜欢