打造像 ChatGPT 这样的人工智能产品的成本很难衡量。微软支持的 OpenAI 的技术需要大量的水,这些水来自爱荷华州中部的浣熊河和得梅因河流域,用于冷却一台强大的超级计算机,帮助其人工智能系统学习如何模仿人类写作。
当微软、OpenAI 和Google等领先的技术开发商竞相利用生成式人工智能的热潮时,他们也承认,对其人工智能工具日益增长的需求会带来高昂的成本,从昂贵的半导体到增加的耗水量。
但他们往往对具体细节秘而不宣。在爱荷华州,很少有人知道这里是 OpenAI 最先进的大型语言模型 GPT-4 的诞生地,直到微软的一位高管在一次演讲中说,该模型"实际上是在得梅因西部的玉米地旁开发的"。
建立大型语言模型需要分析大量人类撰写文本的模式。所有这些计算都需要耗费大量的电力并产生大量的热量。为了在炎热的天气保持凉爽,数据中心需要抽水--通常是抽到仓库大小的建筑外的冷却塔。
微软在其最新的环境报告中披露,从2021年到2022年,其全球耗水量激增了34%(达到近17亿加仑,或超过2500个奥林匹克规格的游泳池),与前几年相比,耗水量急剧增加,外部研究人员认为这与微软的人工智能研究有关。
加州大学河滨分校(University of California, Riverside)的研究员任少磊(Shaolei Ren)说:"可以说大部分耗水量增长都是人工智能造成的,包括它在生成式人工智能方面的大量投资以及与 OpenAI 的合作。"
在即将于今年晚些时候发表的一篇论文中,任少磊的团队估计,每当你向 ChatGPT 提出 5 到 50 个提示或问题时,ChatGPT 就会喝掉 500 毫升的水(接近一个 16 盎司水瓶的容量)。这个范围因服务器的位置和季节而异。这一估算还包括公司没有测量的间接用水量,例如冷却为数据中心供电的发电厂。
"大多数人并不了解 ChatGPT 的资源使用情况,"任说。"如果你不知道资源的使用情况,那么我们就没有办法帮助你节约资源"。
Google同期的用水量增长了 20%,任也将其主要归因于人工智能工作。Google的用水量增长并不均衡--在俄勒冈州,Google的用水量保持稳定,该州的用水量引起了公众的关注,而在拉斯维加斯以外的地区,Google的用水量则翻了一番。在爱荷华州,Google的设备对水资源同样饥渴,其理事会布拉夫斯数据中心的饮用水用量比其他任何地方都要多。
在回答美联社的提问时,微软在本周的一份声明中表示,它正在投资研究,以测量人工智能的能源和碳足迹,"同时研究如何使大型系统在训练和应用中更加高效"。
"我们将继续监控我们的排放量,加快进度,同时增加使用清洁能源为数据中心供电,购买可再生能源,并做出其他努力,以实现我们的可持续发展目标,即到 2030 年实现负碳排放、正水排放和零浪费。"该公司的声明说。
OpenAI 周五在自己的声明中也表达了同样的观点,表示正在"认真思考"如何更好地利用计算能力。它说,"我们认识到大型模型的训练可能是能源和水资源密集型的",并努力提高效率。
微软于 2019 年首次向总部位于旧金山的 OpenAI 投资 10 亿美元,这距离这家初创公司推出 ChatGPT 并引发全球对人工智能进步的关注已有两年多时间。作为交易的一部分,这家软件巨头将提供训练人工智能模型所需的计算能力。
为了至少完成其中的一部分工作,两家公司将目光投向了爱荷华州的西得梅因(West Des Moines),这座拥有 6.8 万人口的城市十多年来一直是微软云计算服务的数据中心聚集地。微软的第四个和第五个数据中心将于今年晚些时候在这里启用。
史蒂夫-盖尔(Steve Gaer)说:"他们正在以最快的速度建造这些数据中心。"吸引该公司的是该市对建设公共基础设施的承诺,并通过纳税为支持这项投资贡献了一笔"惊人"的资金。他补充说:"但是,你知道,他们对自己在那里的所作所为相当保密。"
微软首次表示,它正在为2020年的OpenAI开发世界上最强大的超级计算机之一,当时公司拒绝透露其位置,但将其描述为一个"单一系统",拥有超过285,000个传统半导体内核和10,000个图形处理器--这种芯片已成为人工智能工作负载的关键。
专家们表示,在单一地点"预训练"人工智能模型是有意义的,因为大量数据需要在计算内核之间传输。
直到 5 月底,微软总裁布拉德-史密斯(Brad Smith)才透露,微软已在爱荷华州建立了"先进的人工智能超级计算数据中心",专门用于让 OpenAI 训练其第四代模型 GPT-4。该模型现在为高级版本的 ChatGPT 和微软自己的一些产品提供动力,并加速了关于遏制人工智能社会风险的讨论。它是由加利福尼亚州的非凡工程师制造的,但实际上是在爱荷华州制造的。
从某种程度上来说,西得梅因是一个相对高效的地方,可以用来训练强大的人工智能系统,尤其是与微软位于亚利桑那州的数据中心相比,后者在相同的计算需求下消耗的水资源要多得多。
任少磊说:"因此,如果你要在微软内部开发人工智能模型,那么你应该把训练安排在爱荷华州,而不是亚利桑那州。在培训方面没有任何区别。但在耗水量或能耗方面,差别就大了。"
在一年中的大部分时间里,爱荷华州的天气都很凉爽,微软可以利用外部空气来保持超级计算机的正常运行,并将热量排出大楼。只有当温度超过 29.3 摄氏度(约 85 华氏度)时,微软才会取水,该公司在一份公开披露的文件中如是说。
这仍然会消耗很大的水量,尤其是在夏天。根据西得梅因水厂(West Des Moines Water Works)的数据,2022 年 7 月,也就是 OpenAI 称其完成 GPT-4 培训的前一个月,微软向其爱荷华州数据中心集群泵入了约 1150 万加仑的水。这约占该地区用水总量的 6%,该地区还为该市居民提供饮用水。
2022 年,西得梅因水厂的一份文件称,如果微软的数据中心项目能够"展示并实施在当前水平上大幅降低高峰用水量的技术",以保护住宅和其他商业用水的供应,那么西得梅因水厂和市政府"会考虑这些项目"。
微软周四表示,它正在直接与水务局合作,以解决其反馈的问题。水厂在一份书面声明中表示,微软一直是一个很好的合作伙伴,并一直在与当地官员合作,在满足用水需求的同时减少水足迹。
相关文章
猜你喜欢