近日马斯克等发公开信,呼吁暂停训练比GPT-4更强大的AI系统,至少6个月!原因担心“AI可能杀死全人类”,反正说的挺吓人的。我认为是挺上头的
在国内外巨头纷纷披露AI大模型,在AI领域3大核心是数据、算力、算法,该行认为,数据将成为如ChatGPT等AI大模型的核心竞争力,高质量的数据资源可让数据变成资产、变成核心生产力,AI模型的生产内容高度依赖源头数据。
ChatGPT的中文答案不准确主要在于目前中文语料学习库少,ChatGPT中文资料比重还不足千分之一,为0.09905%,而英文为92.64708%。
ChatGPT能够提炼的语料是开放的、共享的和免费的”,而“中国版ChatGPT”所需要的大量高质量中文数据资源大多被存在各家企业或机构的“后花园”里无法共享,这不是一两间公司能够解决的问题。
针对到这些问题的出现,信息通信研究院现启动大模型技术及应用基准构建工作,针对当前主流数据集和评估基准多以英文为主,缺少中文特点、文化以及难以满足关键行业应用选型需求等问题,
联合业界主流创新主体共同构建一套涵盖多任务领域、多测评维度的基准及测评工具AISHPerf-LargeModel,推动我国大模型技术及应用的引领创新。
中网文公司拥有广泛应用场景,AIGC加速形成从内容到商业化落地的闭环,中文数字内容将成为重要稀缺资源,用于国内AI大模型预训练语料库。
维持互联网传媒行业“买入”评级,拥有中文语料、专业数据资源及数据处理的公司或将持续受益于AI大模型发展。
第一家:浙数文化
围绕数字娱乐、数字体育、大数据产业三大业务板块加速建设数字产业生态圈,是浙江省唯一一家持数据交易牌照的省级数据交易中心,可提供数据流通服务及配套数据增值服务,实现多场景的数据交易,主要客户涉及金融、传媒、公共服务等领域。
第二家:ZG科传
围绕专业学科知识库、数字教育云服务、医疗健康大数据、期刊融合平台等方向,公司传统业务所收集的庞大文献数据可运用于ChatGPT的辅助创作、文档撰写方面。
第三家:掌阅科技
以出版社、版权机构、文学网站、作家为正版图书数字内容来源,对数字图书内容进行编辑制作和聚合管理,面向互联网发行数字阅读产品。
第四家:是最具有潜力的
理由一:与清华相关院系长期深入合作,知网具备国内首屈一指的中文知识库,在于算力、算法和数据等要素齐全,资源整合和服务能力强。
理由二:公司控股股东是G资委,背靠大树好乘凉。
理由三:技术上主力洗盘充分,处于历史低位10元以下,近期处于上升趋势,成交量堆量,上涨放量下跌缩量,筹码集中且没有松动,说明主力还在收集筹码,准备干一波大的,我也非常看好这股启动一波主升浪,今年至少100CM 。
具体就不在这里讲了,启动就在一瞬间,我会分享在粉丝群。
相关文章
猜你喜欢