光大海外：中文数字内容成为重要稀缺资源相关公司将充分受益AI大模型发展-脚本导航

> 自媒体 > （AI）人工智能 > 光大海外：中文数字内容成为重要稀缺资源相关公司将充分受益AI大模型发展

光大海外：中文数字内容成为重要稀缺资源相关公司将充分受益AI大模型发展

来源：智通财经

2023-06-30 16:29:44

310

管理

智通财经APP获悉，光大海外发布研究报告称，3月28日，中国信息通信研究院现启动大模型技术及应用基准构建工作，针对当前主流数据集和评估基准多以英文为主，缺少中文特点、文化以及难以满足关键行业应用选型需求等问题。其中网文公司拥有广泛应用场景，AIGC加速形成从内容到商业化落地的闭环，中文数字内容将成为重要稀缺资源，用于国内AI大模型预训练语料库。维持互联网传媒行业“买入”评级，拥有中文语料、专业数据资源及数据处理的公司或将持续受益于AI大模型发展。

推荐：中文在线(300364.SZ)、阅文集团(00772)，关注拓尔思(300229.SZ)、海天瑞声(688787.SH)、同方股份(600100.SH)、浙数文化(600633.SH)、浙文互联(600986.SH)、中国科传(601858.SH)、掌阅科技(603533.SH)。

事件：3月28日，中国信息通信研究院现启动大模型技术及应用基准构建工作，针对当前主流数据集和评估基准多以英文为主，缺少中文特点、文化以及难以满足关键行业应用选型需求等问题，联合业界主流创新主体共同构建一套涵盖多任务领域、多测评维度的基准及测评工具AISHPerf-LargeModel，推动我国大模型技术及应用的引领创新。

光大海外主要观点如下：

中文数字内容将成为重要稀缺资源，用于国内AI大模型预训练语料库。

1)近期国内外巨头纷纷披露AI大模型;在AI领域3大核心是数据、算力、算法，该行认为，数据将成为如ChatGPT等AI大模型的核心竞争力，高质量的数据资源可让数据变成资产、变成核心生产力，AI模型的生产内容高度依赖源头数据。2)ChatGPT的中文答案不准确主要在于目前中文语料学习库少，ChatGPT中文资料比重还不足千分之一，为0.09905%，而英文为92.64708%。3)中文公开语料远不足英文，这也成为“中国版ChatGPT”的痛点。微软(中国)首席技术官韦青在3月23日举行的一场行业会议上指出，“ChatGPT能够提炼的语料是开放的、共享的和免费的”，而“中国版ChatGPT”所需要的大量高质量中文数据资源(包括政务数据、商业数据、科研数据、中文语料等)大多被存在各家企业或机构的“后花园”里无法共享，“这不是一两间公司能够解决的问题，需要全社会密切关注并大力投入的公共知识基础设施”。4)政策进一步重视数据核心资产建设。据媒体报道，从4月1日起，部分外国用户对中国大陆知识基础设施工程的访问将被限制，其中包括知网。

网文平台深耕文化数字产业，海量正版中文数字内容构筑核心竞争壁垒。

1)海量数据：网文平台拥有的中文文字字数超10000亿字，内容品类包含小说类、科普类、社会类、经管类、法律类、教育教材类等等。2)高质量数据：网文平台拥有的数字内容经过市场长期校验，已形成高质量的数据内容库，而高质量的数据可大幅提升模型训练效果，缩短学习时间和提升学习质量，让AI模型产出内容稳定;3)正版版权：网文平台高度重视知识产权保护工作，可为AI模型公司提供拥有版权的数据集用于训练;4)完整的各类型商业生态链：平台拥有的网络原创驻站作者可实时反馈最新数据，提供最贴近市场和用户的最新数据，让AI模型持续更新学习。

网文公司拥有广泛应用场景，AIGC加速形成从内容到商业化落地的闭环。

网络文学为最大的内容源头，当前大量优质网文IP尚未被挖掘和开发变现，而AIGC加快发展产能，推动海量IP跨模态变现。AI技术成果可应用在文字辅助创作、实时对话互动、动漫画及影视创作等场景，服务广大内容创作者，打通IP衍生全产业链商业变现。

风险提示：AI技术研发和产品迭代不及预期风险;AI行业竞争加剧风险;商业化进展不及预期风险;国内外政策风险。

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

ChatGPT 真能抢走你的饭碗？我帮你问了律师、编剧、程序员

2023-06-30 16:30

ChatGPT语音转文字来了：每分钟收费4分钱中文还不太行

2023-06-30 16:28