本报记者 曲忠芳 李正豪 北京报道
由OpenAI推出的通用型对话机器人ChatGPT持续引发全球范围的“AI狂欢”。一时之间,资本圈、产业界、创业者等无不趋之若鹜,试图抓住新一轮人工智能的重大产业机遇,国内大小企业同样不想错过。
截至2月15日,百度、腾讯、科大讯飞、阿里巴巴、京东、360、网易有道、寺库、万兴科技等众多国内厂商纷纷发声,称已有ChatGPT相关的技术积累,或即将推出对标ChatGPT的产品、整合新技术到既有业务中,以至于“中国版ChatGPT”“中国版OpenAI”等概念在社交媒体成为热门话题。不过,在喧嚣与热闹之中,究竟谁在“蹭热点”,谁有“真本事”,显然并不取决于谁的“嗓门高”,而是有待市场的检验。
需要指出的是,ChatGPT并不是开源软件,产品在国内市场尚未开放,目前是以API(应用程序编程接口)调用的方式服务。ChatGPT带来的技术突破背后需要投入多大的成本?国内科技大厂及AI企业如何追赶这一波技术浪潮?所谓“中国版ChatGPT”将如何落地实现?……针对这些业界关注的问题,《中国经营报》记者采访了多位业内人士以及第三方专家,尽管对ChatGPT的看法见仁见智,但受访人士普遍认为,ChatGPT是继2006年深度学习(Deep Learning)提出之后一个里程碑式的技术革命,有望从底层推动社会生产力跃升,进一步加速AI发展和应用。
5000万美元入局够吗?
就在2月13日,已“退休”两年的美团联合创始人王慧文在社交平台高调发声,称“打造中国OpenAI,设立北京光年之外科技有限公司”,并表示“出资5000万美元,估值2亿美元”,据媒体报道已有包括源码资本等在内的风投机构认购2.3亿美元。对于王慧文此举,源码资本创始合伙人曹毅通过朋友圈表示“支持”。
关于王慧文究竟是要创立一家类似OpenAI的企业或组织机构,还是要组队研发一款类似ChatGPT的产品,以及如何实现其“中国OpenAI”的愿望,本报记者通过邮件联系王慧文希望进一步核实与采访,但截至发稿暂未获得回复。
几乎同一时间,出门问问创始人兼CEO李志飞也发声评论,他认为“2023年是AI大模型时代元年”,如果把搞中国版OpenAI/ChatGPT“比作一场运动竞赛,那么2023年Q1(第一季度)是报名阶段,目前的报名费是5000万美元起”。
OpenAI创立于2015年,最初的定位是一家开发造福全人类AI技术的非营利性组织,后来变成非营利性与营利性的混合式组织。因为并非上市公司,OpenAI的财务状况没有公开。据美国媒体报道,2022年该公司的营收约为3600万美元,但成本花费约5.44亿美元,也就是仅2022年就亏损了5亿美元。从2018年起,基于谷歌提出的、开源的Transformer神经网络架构,OpenAI开始发布生成式预训练语言模型GPT,可用于生成文章、代码、机器翻译、问答等各类内容,每一代GPT模型的参数量(指模型中含有多少个参数,是衡量深度学习算法的重要指标)都实现迅猛增长,第一代参数量为1.17亿,而2019年2月的GPT-2参数量为15亿,2020年5月发布的GPT-3参数量达到了1750亿。ChatGPT则是基于GPT-3.5架构开发的对话AI模型,被视为在GPT-4正式推出前的演练。
ChatGPT火爆的同时,其背后的成本支出也引发业内的关注。作为OpenAI早期投资人的埃隆·马斯克在推特平台提问ChatGPT“每次聊天的平均成本是多少”。OpenAI的CEO山姆·阿尔特曼回复称,ChatGPT平均每次的聊天成本为“个位数美分”,并表示正在试图更加准确地计算,同时也在努力优化(成本)。
国盛证券计算机团队在研报中粗略估算了ChatGPT的访问算力和前期训练两项费用,其中初始投入近十亿美元,单日电费达数万美元;在公有云下,单次训练约为百万至千万美元。该研报援引研究机构SimilarWeb的数据——2023年1月,平均每天约有1300万独立访客使用ChatGPT,访问阶段算力每天发生,其成本成为衡量ChatGPT最主要投入的关键指标。以英伟达A100芯片、DGX A100服务器、现阶段每日2500万访问量等假设条件为基础,估算得出,在初始算力投入上,为满足ChatGPT当前千万级用户的咨询量,投入成本约为8亿美元,对应约4000台服务器;在单日运行电费上,参考美国平均0.08美元/kWh工业电价,每日电费约为5万美元,成本相对高昂。模型的前期训练成本同样值得关注,基于参数数量和token(指客户端不断向服务端请求数据,服务端不断去数据库查询用户名和密码并进行对比)数量估算,GPT-3训练一次的成本约为140万美元;对于一些更大的LLM(大型语言模型)模型,采用同样的计算公式可得出,训练成本介于200万美元至1200万美元之间。报告指出,百万至千万美元级别的训练成本并不便宜,但对于科技大企业而言尚在可接受范围内。
谦询智库合伙人龚斌指出,ChatGPT是基于超参数AI大模型,大模型LLM的参数增长是指数级增长的,对算力和电力需求惊人,LLM训练的能耗和碳排放巨大。如此高的资金、算力和能源门槛,传统的开源模式已经玩不转了。这个游戏要持续能玩,5000万美元只是起步价,快速追赶者的投入起码要5亿美元,计算领域的生产工具和生产资料,正在快速集中化和“寡头化”。
深度科技研究院院长张孝荣认为,所谓中国版ChatGPT,因各家的技术路线并没有详细披露,或许跟ChatGPT不一样。这些产品能否持续发展、获得市场认可,还不好说,需要等上线后持续关注和观察。
搜索引擎“首当其冲”背后
2023年2月2日,微软宣布旗下所有产品将全线整合ChatGPT,包括Bing(必应)搜索引擎、Office、云平台Azure等。5日后,微软整合ChatGPT技术的Bing搜索引擎和Edge浏览器亮相。需要指出的是,微软从2019年起投资OpenAI10亿美元,并提供云服务支持。未来,微软还将继续投资数十亿美元,据美媒报道,微软计划投入资金将达100亿美元。
值得注意的是,ChatGPT的上线以及微软在搜索领域的“挑战”动作,让全球搜索市场的“霸主”谷歌拉响“红色警报”。谷歌CEO桑达尔·皮采亲自挂帅,紧急推出了基于其人工智能技术的聊天机器人Bard。不过,因为产品演示出现错误,拖累了谷歌母公司Alphabet的股价表现。
据美国网站通信流量监测机构Statcounter在2022年3月发布的数据报告称,在全球搜索引擎市场,谷歌占据91.55%的份额,微软Bing的市场份额为1.5%,百度占比1.47%。在中国搜索市场,百度以84.3%的份额位居第一位,排在其后的必应、搜狗的份额分别为6.7%、3.08%。
作为国内搜索市场的“老大”百度,在2月7日官方确认将推出类似ChatGPT产品的消目,项目中文名为“文心一言”,预计3月完成内测,面向公众开放。据媒体报道,该项目由百度CTO(首席技术官)王海峰带队,由百度文心大模型团队实际推进。对此,百度方面暂未透露更多信息。
曾在国内搜索市场中扮演“挑战者”角色的360方面透露计划推出类ChatGPT技术的demo(样片,试用版)产品,发布日期和实际效果存在不确定性。作为创始人的周鸿祎公开表示,如果企业搭不上ChatGPT这班车,很可能会被淘汰,360不会放弃对该技术的跟踪。
ChatGPT为何一出现就搅动了多年变化微小的搜索市场?众所周知,搜索引擎作为互联网时代的代表产物,既是用户流量的入口,又是主动“暴露”需求的途径,长久以来形成了一套生态系统。随着移动互联网时代的来临,App商店及大繁荣的App应用抢食了浏览器及搜索的入口流量。ChatGPT对自然语言的理解能力,打破了搜索引擎那种传统的一问一答与程序格式指令模式,有望重塑搜索市场。
上海人工智能研究院副总工程师沈灏向记者指出,ChatGPT作为一种通用型的产品形态展现在用户面前,对普通大众的认知与影响力是巨大的。它对搜索市场来说会产生较大的冲击,改变搜索的模式和习惯。市场格局的变化暂时还不好说,毕竟还没有看到国内的产品情况。从用户体验来说,整体可能会逐渐向搜索、浏览、对话的混合模式发展。
在思必驰联合创始人、首席科学家俞凯看来,搜索引擎和基于搜索的相关产业未来有可能被颠覆。搜索引擎类的应用,甚至信息搜索类的应用,属于基础性应用。当底层搜索引擎被颠覆的时候,所有和信息搜索相关的这种产业都会发生变革。从垂直领域来看,被影响的行业就更多了。无论是从金融、医疗、制造等各领域,凡是需要用到信息搜索,都有可能会发生相应的变革。
对国内AI企业的启发
沈灏认为,ChatGPT的火爆是一个从量变到质变的结果,为了形成质变,无论从算力硬件、核心技术、数据挖掘、人才团队、投资环境等各方面都需要关注。
云从科技创始人兼董事长周曦在财报电话会议中表示,ChatGPT是大数据大模型下的延续。通过分配范式,一方面将核心技术投入通用化,另一方面快速将应用场景化,从而带动边际效应,加速各个行业的智能化进程。
旷视研究院基础科研负责人张祥雨则指出,在能力上,ChatGPT背后的关键技术底座是生成式大模型,而模型设计能力也是旷视研究院多年来积累的核心能力。生成大型式大模型有望突破图像大模型的上限,并推动底层架构的统一。旷视研究院会坚定投入生成式大模型的研发。
俞凯也表示,GPT的核心是大模型技术和对话智能技术,其中大模型技术主要有三块:上下文学习,思维链推理,指令学习。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。换言之,底层基础的算法是公开的,并不存在算法上的明显差距。当数据量足够大,微不足道的数据差距影响没那么明显。目前,国产AI需要追赶与提升的方面,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。
老牌AI企业科大讯飞副总裁、研究院执行院长刘聪表示,“兴奋归兴奋,关键是要踏实把科研做好,把产品做好,把服务做好”。科大讯飞提出人工智能红利能否兑现的三大标准是,有没有看得见摸得着的真实应用案例,有没有能够规模化推广应用的产品,有没有统计数据能够证明的应用成效。
海银资本创始合伙人王煜全认为,AI语言大模型属于“产业增强”类型的热潮,这一轮看似热闹,但因为高额的投入门槛,最后赢家只会上少数几个平台。第二轮热潮会在中国版ChatGPT真正出现后到来,属于大多数人的“模式创新”机会。中国ChatGPT的开发既要解决算法上的问题,还要积累一个与超大规模算法匹配的优质数据库,前者靠聪明的大脑或许能加速不少,但后者就是实打实的苦功夫,会成为不少AI企业面对的最大难点。
相关文章
猜你喜欢