“千模大战”100天：六路玩家围攻ChatGPT-脚本导航

> 自媒体 > （AI）人工智能 > “千模大战”100天：六路玩家围攻ChatGPT

“千模大战”100天：六路玩家围攻ChatGPT

来源：智东西

2023-05-30 10:39:59

293

管理

互联网/云大厂推出大模型的情况

众所周知，打响应战ChatGPT第一枪的互联网大厂是百度，今年3月面世的文心一言（ERNIE Bot）是百度在2021年12月推出的百度·文心（ERNIE 3.0 Titan）迭代而来的细分模型，百度创始人李彦宏称将用其重构百度所有的应用。而后，首个跳出来硬刚百度的是阿里。4月11日，阿里云推出通义千问大语言模型（LLM），阿里董事会主席兼CEO张勇宣布，阿里所有产品将接入大模型全面升级。阿里的大模型进展公开可追溯到2021年10月的云栖大会。

AI企业推出的大模型

在第一类AI企业中，最受关注的无疑是NLP领域龙头企业科大讯飞，其于5月6日推出的“星火”大模型已开启内测，与文心一言打擂台。

此外还有商汤科技，其于4月10日推出“日日新SenseNova”大模型体系，包括其自研中文语言大模型应用平台“商量”等。近期，包括云从科技、云知声、旷视科技等专用AI起家的知名企业都披露了大模型动向。这类企业具有AI算法研究的人才队伍及经验积累，长处在于算法研发和行业工程化突破。

商汤科技推出日日新大模型

第二类企业是AI大模型原生企业，如昆仑万维，其在4月10日正式推出千亿级大语言模型“天工3.5”，对标ChatGPT、支持万字以上的文本对话。有很多AI大模型企业创立不久，比如创立于2021年的澜舟科技、MiniMax等，但其团队成员做大模型的时间却跨越数年。这波大模型浪潮的到来令这些企业压力不小，催促其加快结合细分赛道的产业化探索。

可以看到，在这些大模型的领域分布上，NLP仍是目前大模型研发最为活跃的重点领域，其次是多模态领域，在CV和智能语音等领域的大模型还较少。

AIGC大模型已成为热门投资领域，金沙江创投管理合伙人朱啸虎近日发文透露今年的投资策略，称今年一半投资都给了AIGC。反过来对于AI公司来说，推出大模型有望帮公司吸引更多资金以推动估值上涨，比如刚刚推出AI大语言模型“序列猴子”的出门问问，就被彭博社爆料正推动港股IPO，可能筹集约2亿至3亿美元。

在互联网大厂的团战之下，AI创企的空间有多大？

对此多位业内人士和投资人告诉智东西，AI大模型领域不同于互联网“大补贴”时代，可能不会赢家通吃，而是百花齐放。

一方面，大语言模型在产业可能仍是大厂主导，因为参赛入场券是足够的钱、数据、算力及人才。比如OpenAI三年前接受了微软为其打造的一台由数万个A100 GPU组成、价值数亿美元的大型AI超级计算机，据推测标准大小的ChatGPT-175B大概需要625台8卡DGX A100服务器进行训练，成本约达到3~5亿元人民币。创企融来的几亿元在这个层面几乎做不了什么，大厂则资金相对充裕。

但另一方面，有业内人士告诉智东西，一些关键点突破可能还要看科创公司。据悉，国内AI企业的大模型很多是基于GPT-2开源模型开发而来，与GPT-4仍有代际差。由于GPT-4是闭源的，国内企业无法参考论文而只能自行研发追赶，并不是投钱和时间就能攻克的。因此从算法层面来说，AI创企与互联网大厂可以说站在同一起跑线，甚至聚焦创新的能力会更强。

正因为AI大模型算法结构突破难度大，许多创企公司都是由高校及科研机构成果孵化而来。与此同时，众多高校直接推出了大模型，包括复旦大学、清华大学、武汉大学等。

根据《中国人工智能大模型地图研究报告》，大模型的学术影响力已初步形成，但仍有提升空间。在开源影响力方面，国内大模型研发团队在积极推进大模型开源发展，目前已经有超过半数大模型实现开源，且高校和科研机构是开源主力。

高校及科研机构布局大模型的情况

即便是基于强大科研成果，AI初创企业要突围还需要花些巧劲。正如创世伙伴资本合伙人梁宇此前告诉智东西：“创企要学会躲开‘巨兽踩下的脚印’，所有伟大的公司都是从很小的缝隙中钻出来的。”

在大厂领跑的同时，初创公司的机会可能在应用层，从垂直领域切入做产业落地、降本增效。比如澜舟科技聚焦的就是金融领域。其于3月14日推出孟子对话大模型，而早在2021年7月推出了孟子（MChat）大模型及相关系列开源模型。基于Transformer，孟子大模型可支持以及快速替换自回归（如GPT）、自编码（如BERT）等多种预训练模型。

三、行业公司与算力企业纷纷入局，抢占绝佳站位

说到AI大模型竞赛，数据是必不可少的一环。行业公司掌握海量数据，是这波“千模大战”中另一类不容小觑的选手。

据智东西统计，截至目前至少有15家行业公司推出了行业大模型。其中，金融领域涉及的企业最多，包括中国农业银行、江苏银行、度小满、奇富科技等；教育领域涉及的企业仅此其后，包括网易有道、学而思、淘云科技、孩子王等推出或计划推出大模型。此外，医疗、自动驾驶、智能物联等领域的行业公司都已经行动。

行业公司推出的大模型

随着大模型产业化落地加速推进，目测一大批来自各个行业的大模型也将喷涌而出。

行业头部公司由于接近客户和落地场景，因此更容易在数据、应用落地方面占据优势。比如近日，度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来，在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上，效果相较于通用大模型大幅提升。

说到数据，实际上也有一些大数据起家的公司推出了大模型。比如大数据公司达观数据就于3月18日推出了曹植大模型，不过具体参数和应用效果还不清楚。

大数据公司推出的大模型

此外，一些算力公司也推出了大模型。比如4月29日消息，联发科在4月28日发表官方博客称，联发科AI研究小组近日发布了全球第一个繁体中文大型语言模型BLOOM-zh。多语言模型BLOOM-zh在保持其英语功能的同时，在大多数繁体中文基准上优于其前身。

国内服务器头部企业浪潮甚至在2021年9月就推出了源1.0大模型。根据公司2月在深交所互动平台上的发言，源1.0模型结构与GPT-3类似，与GPT-3相比参数量增加40%，训练数据集提升10倍，达到了2457亿参数，训练使用了5TB的高质量中文数据。消息称，源2.0也将在不久之后发布。

国家超算天津中心于5月19日推出了“天河E级智能计算开放创新平台”和“天河天元大模型”，据称将带来突破百亿次的跨模态的超级计算算力，支撑传统的科学工程计算，并服务智能混合计算，成为智算中心机构布局大模型的代表。

可以看到，行业、大数据、算力领域的大模型入局玩家还不多。但由于这些领域的企业往往拥有算力和算力优势，如果与AI大模型企业合作，有望在大模型领域实现超车，这都为“千模大战”的战况带来更多变数。

结语：千模大战打响，研发和落地是持久战

仅仅两个月时间，国内的大模型之战已经打响，互联网/云服务大厂、AI企业、行业公司、大数据公司以及算法公司全都入局了。

可以看到，入局的公司要么在资本实力、平台生态、应用场景方面占据优势，要么在算法、算力和数据层面构筑了护城河，但这都只是一张“入场券”。

AI大模型创业将是一场持久战。国内的大模型产品大多与GPT-4仍有代际差，这毕竟是一个高难度的系统性工程，仍需要国内大模型玩家深耕技术、贴合应用，以此在硅谷巨头的包围中实现突破。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

美国律师偷懒用ChatGPT打官司，惨烈翻车！各种案例张嘴就胡编？

2023-05-30 10:40

怎么看ChatGPT？听听数博会的声音

2023-05-30 10:38