计算机深度报告：ChatGPT引发的大模型时代变革-脚本导航

> 自媒体 > （AI）人工智能 > 计算机深度报告：ChatGPT引发的大模型时代变革

计算机深度报告：ChatGPT引发的大模型时代变革

来源：金融界

2023-08-12 17:01:23

262

管理

华安证券：尹沿技王奇珏胡杨张天金荣

ChatGPT引发的大模型时代变革，数据要素重要性提升

ChatGPT是由OpenAI研发的一种语言AI模型，其特点在于使用海量语料库来生成与人类相似的反应。初代GPT模型参数1.17亿，GPT2模型、GPT3模型参数分别达到15亿、1750亿。不断提升的参数量级，使得ChatGPT3当前已经能够应用在商业、研究和开发活动中。

当前此类参数体量庞大的模型，成为各大科技厂商研发的重点。大模型的基础为高质量大数据。ChatGPT的前身GPT-3就使用了3,000亿单词、超过40T的数据。此类大数据基础的前提为三部分1）有效场景下的采集数据；2）大数据的存储、清洗和标注；3）数据质量检验。

大模型发展之下，算力与网络设施建设成为刚需

算力：随着参数量和语料库指数级的扩容，ChatGPT类人工智能需要更充足的算力支持其处理数据，同时需要投入更多高性能的算力芯片来处理千亿级别参数量。英伟达的研究表示，GPT-3模型需要使用512颗V100显卡训练7个月时间，或者使用1024颗A100芯片训练长达一个月的时间。2012 年以来，人工智能训练任务中的算力增长（所需算力每3.5月翻一倍）已经超越芯片产业长期存在摩尔定律（晶体管数量每18月翻一倍）。

网络设施：以目前独家开放了ChatGPT调用能力的微软Azure为例，其AI基础设施由互联的英伟达 Ampere A100 Tensor Core GPU组成，并由Quantum infiniBand交换机提供强大的横向扩展能力。根据微软宣布，每台GPU服务器网络连接能力为400Gbps。服务器节点多、跨服务器通信需求巨大，网络带宽性能成为GPU集群系统的瓶颈，解决的方式包括增加单节点通信带宽与降低网络收敛比。由此带来光模块、交换机等网络设施需求。

下游应用场景丰富，多行业落地可期

1）“生成式AI （generative AI）”在互联网及元宇宙领域市场化空间较为广阔。基于现行的NLP算法发展程度及数据集规模，在不久的将来，生成式AI有较大可能在“智能客服”和“搜索引擎”进行增值，并有希望以“插件”的形式赋能现有的“生产力工具链（工程软件/音视频制作工具等）”。

2）人工智能在制造业的应用可分为三方面：a）智能装备：指具有感知、分析、推理、决策、控制功能的制造装备，典型代表有工业机器人、协作机器人、数控机床等；b）智能工厂：利用各种现代化的技术，实现工厂的办公、管理及生产自动化，典型的代表场景有协作机器人、智能仓储物流系统等；c）智能服务：指个性化定制、远程运维及预测性维护等，典型代表有工业互联网等。

3）人工智能在智能汽车领域的应用包括：a）智能驾驶依托人工智能技术，将从驾驶辅助发展至自动驾驶；b）智能座舱在人工智能技术的支持下，从出行工具演变为出行管家。

风险提示

国内大模型不及预期风险；行业竞争加剧风险；AI应用的伦理道德风险；芯片及芯片技术供应风险；商业模式变现与落地不及预期风险。

本文源自券商研报精选

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

一个AI撰写的博客着重指出了人类对GPT-3的错误判断

2023-08-12 17:04

总结一下全球厂商的GPU数量以及训练GPT-3/LLaMA2所需要的GPU数量

2023-08-12 16:54