(报告作者:国盛证券分析师 刘高畅)
9 月 19 日,据 The Information 报道,OpenAI 意图赶在谷歌推出多模态大语言模型 Gemini 前广泛推出名为GPT-Vision 的多模态功能,此前 OpenAI 在 3 月份推出 GPT-4 时展示了多模态功能,但并未向除了 Be My Eyes 之外的公司提供,未来 OpenAI 或许会推出一个更强大的多模态大模型,代号为 Gobi。此前在 5 月 10 日的谷歌I/O 2023 大会谷歌就已宣布了下一代多模态基础模型 Gemini 在训练中。我们认为 AI 领军企业 OpenAI 与科技巨头谷歌在多模态大模型上竞相提速彰显了多模态技术的重要性,并有利于推动多模态 AI 尤其是基础模型取得进步,进一步推动多模态相关应用落地。
应用增长及多模态数据处理复杂度提高催生算力需求。多模态模型需要处理的输入和输出信息将包括文本、图像、视频、音频等,复杂度远超纯文本数据,同时将不同模态的特征进行融合,找到不同模态间的内在关联和交互关系也需要更复杂的模型架构,这也增加了计算负载,要发挥多模态模型的优势,必须有强大的算力支持。同时多模态发展打开广阔下游应用空间,用户增长将让应用厂商在模型推理侧需要更多算力,进一步催生算力需求。
以上内容仅供学习交流,不构成投资建议。
精选报告来源:文库-远瞻智库相关文章
猜你喜欢