2457亿参数！全球最大AI巨量模型「源1.0」发布中国做出自己GPT-3-脚本导航

> 自媒体 > （AI）人工智能 > 2457亿参数！全球最大AI巨量模型「源1.0」发布中国做出自己GPT-3

2457亿参数！全球最大AI巨量模型「源1.0」发布中国做出自己GPT-3

来源：新智元

2023-05-04 21:58:46

558

管理

编辑：好困 yaxin

【新智元导读】古代文人，或一觞一咏，畅叙幽情，或风乎舞雩，咏而归。「吟诗作对」成为他们的标配。刚刚，全球最大人工智能巨量模型「源1.0」发布，能赋诗作词，比人类还像人类。

理科生文艺起来，可能真没文科生什么事儿了。

不信？你看看这首七言诗：

虽非蟾宫谪降仙，何惧冰殿冷彻骨。

窥帘斜视金屋小，多少俊才在此关。

读完之后，不得不说真牛啤！意境内涵都很赞。

不仅能写诗，还能做词，比如下面这首：

疑是九天有泪，

为我偷洒。

滴进西湖水里，

沾湿一千里外的月光，

化为我梦里的云彩。

你能想象，这是完全不懂写诗的理工生的杰作吗？

确实如此。简直让李白看了会沉默，让杜甫看了会流泪。

图源：writeup.ai

数据方面，「源1.0」几乎是把近5年整个中文互联网的浩瀚内容全部「读」完了。通过自研的文本分类模型，获得了5TB高质量中文数据集，在训练数据集规模上领先近10倍。

此外，「源1.0」还阅读了大约2000个亿词。这是什么概念呢？

假如人一个月能读十本书，一年读一百本书，读50年，一生也就读5000本书，一本书假如20万字，加起来也只有10亿字，需要一万年才能读完2000亿词。在如此大规模的数据加持下，「源1.0」的数据集也自然成为了全球最大的高质量中文数据集。

算力方面，「源1.0」共消耗约4095PD（PetaFlop/s-day）。相对于GPT-3消耗3640PD计算量得到1750亿参数，计算效率大幅提升。如果说，让「源1.0」一天24小时不间断「阅读」的话，只需要16天就可以看完近五年中文互联网的几乎全部内容。

嗯？原来已经把近5年的中文互联网内容全学完了？

u1s1，「源1.0」yyds！

其中，正确率是指能正确将机器生成的文本识别出来的比例。正确率<70%，意味误判率超过30%。

数据看着太单调？没事！大家期待的「真题」环节来了！

对联

上联

问题1

五湖四海皆春色

三江八荒任我游

万水千山尽得辉

问题2

春来人入画

福至梦开花

夜半月当灯

问题3

和风吹绿柳

时雨润春苗

细雨润青禾

问题4

三江顾客盈门至

四季财源滚滚来

百货称心满街春

诗歌

问题1

满目青山夕照明，愿随江舟泛轻风。

今生常忆多情事，香闺如梦领神会。

塞上长城万里长，漫天风雪映重峦.

一边江水人心去，满目青山绝照还。

问题2

燕垒空梁画壁寒，诸天花雨散幽关，篆香清梵有无间。

蝶梦似曾留锦袖，绛河如又湿团扇，风来香去苦栏干。

问题3

夜战桑乾北，秦兵半不归。

朝来有乡信，犹自寄寒衣。

战鼓催征千嶂寒，阴阳交会九皋盘。

飞军万里浮云外，铁骑丛中明月边。

答案在文末哦～

世界第一是怎样一种体验？

那么，这个拿下世界第一的最大AI模型，到底有多强？

不如拉出来跑个分、刷个榜看看！

英文语言模型评测有GLUE、SuperGLUE，例如GPT-3这类的各种预训练模型都会在上面进行评估。和GLUE类似，CLUE是中文第一个大规模的语言评估基准。其中包了括代表性的数据集、基准（预训练）模型、语料库和排行榜。而这些数据集也会覆盖不同的任务、数据量、任务难度等。

当前，语言模型的训练已经从「大炼模型」走向「炼大模型」的阶段，巨量模型也成为业界关注的焦点。

近日，李飞飞等斯坦福研究者在论文中阐述了类巨量模型的意义在于突现和均质。在论文中，他们给这种大模型取了一个名字，叫基础模型（foundation model），并系统探讨了基础模型的机遇与风险。

图源：跨象乘云

那么，开发者们能从这块「黑土地」上得到什么？

浪潮源1.0大模型只是一个开始，它只是提供一片广阔的肥沃土壤。

浪潮未来将定向开放大模型API，服务于元脑生态社区内所有开发者，供全球的开发人员在平台上开发应用于各行各业的应用程序。

各种应用程序可以通过浪潮提供的 API进行基于大模型的搜索、对话、文本完成和其他高级 AI 功能。

其实，不管是1750亿参数，还是2457亿巨量参数语言模型，最重要的是它能否真正为我们所用。要说上阵，真正的含义并不是在发布会上的首秀，而是下场去在实际场景中发挥它的作用和价值。

浪潮信息副总裁刘军表示，「首先从大模型诞生本身来说，还有另外一个意义，那便是对于前沿技术的探索，需要有大模型这么一个平台，在这个平台上才能支撑更进一步的创新。」

「其次，在产业界我们很多产业代表提出来的杀手级的应用场景，比如说运营商智能运维，在智能办公场景报告的自动生成，自动对话智能助手。」

「源1.0」大模型能够从自然语言中「识别主题并生成摘要」的能力，让各行各业公司的产品、客户体验和营销团队更好地了解客户的需求。

例如，未来大模型从调查、服务台票证、实时聊天日志、评论等中识别主题、情绪，然后从这个汇总的反馈中提取见解，并在几秒钟内提供摘要。

如果被问到「什么让我们的客户对结账体验感到沮丧？」

大模型可能会提供这样的见解：「客户对结账流程感到沮丧，因为加载时间太长。他们还想要一种在结账时编辑地址并保存多种付款方式的方法。」

未来，浪潮源1.0大模型将推动创新企业及个人开发者基于大模型构建智能化水平更高的场景应用，赋能实体经济智能化升级，促进经济高质量发展。

图灵测试答案

对话

问题1

问题2

问题3

问题4

对联

问题1

问题2

问题3

问题4

诗歌

问题1

问题2

问题3

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

用更少GPU完成更多计算量，中文巨量模型源1.0比GPT-3强在哪里？

2023-05-04 21:59

GPT-3：一个有望通过图灵测试的人工智能模型

2023-05-04 21:57