paint-brush
人工智能技术及其秘密水足迹经过@TheMarkup
286 讀數

人工智能技术及其秘密水足迹

经过 The Markup7m2024/02/10
Read on Terminal Reader

太長; 讀書

还有,你好!我是 Nabiha Syed,The Markup 的首席执行官,我恰好相信技术进步可以与健康的地球共存——如果我们把它作为优先事项的话。继续阅读,了解一次 ChatGPT 对话可能“喝”多少水,以及我们可以采取哪些切实措施来减少人工智能的水足迹。
featured image - 人工智能技术及其秘密水足迹
The Markup HackerNoon profile picture

人工智能的热门话题无处不在:取决于你的看法,生成式人工智能要么会杀死我们,夺走我们的工作,将我们从苦差事中解放出来,要么会刺激巨大的创新。 (无论哪种方式,对监管的呼声都在这里。)在 The Markup,我们喜欢采取谨慎的方法,通常包括衡量实际后果。


因此,我很高兴与加州大学河滨分校计算机科学副教授任少雷分享这个问答,他和他的团队——河滨分校博士。候选人李鹏飞杨建一,以及德克萨斯大学阿灵顿分校计算机科学副教授Mohammad A. Islam最近发表了一篇量化人工智能秘密水足迹的论文。


虽然新兴技术的碳足迹已经引起了一些关注,但要真正实现可持续发展,水也必须成为其中的一部分。


还有,你好!我是 Nabiha Syed,The Markup 的首席执行官,我恰好相信技术进步可以与健康的地球共存——如果我们把它作为优先事项的话。继续阅读,了解一次 ChatGPT 对话可能“喝”多少水,以及我们可以采取哪些切实措施来减少人工智能的水足迹。


(为了简洁明了,本问答已被编辑。)

图片说明:从左到右:Pengfei Li、Jianyi Yang、Mohammad A. Islam、Shaolei Ren 图片来源:Credits,从左到右:Qiaoxiao Chen、UC Riverside、UT Arlington、UC Riverside

Syed:有充分的理由,我们开始看到对各种技术的碳足迹进行更多审查,包括 GPT-3 和 GPT-4 等人工智能模型以及比特币挖矿。但您的研究重点是不太受关注的事情:人工智能技术的秘密水足迹。告诉我们您的发现。


任正非:由于各种原因,水足迹一直未被关注,其中包括淡水是“无限”资源的巨大误解以及水的价格相对较低。许多人工智能模型开发人员甚至不知道他们的水足迹。但这并不意味着水足迹不重要,尤其是在加利福尼亚等干旱地区。



我与我的学生和 UT 阿灵顿大学的合作者一起,使用最先进的估计方法对人工智能的水足迹进行了一些研究。我们发现大规模的人工智能模型确实是耗水大户。


例如,在微软最先进的美国数据中心训练 GPT-3 可以直接消耗 70 万升清洁淡水(足以生产 370 辆宝马汽车或 320 辆特斯拉电动汽车),如果培训是在微软亚洲数据中心进行的。这些数字不包括与发电相关的厂外水足迹。


对于推理(即与 ChatGPT 的对话),我们的估计表明 ChatGPT 需要一瓶 500 毫升的水来进行大约 20 到 50 个问题和答案的简短对话,具体取决于模型部署的时间和地点。鉴于 ChatGPT 庞大的用户群,推理的总水足迹可能是巨大的。


然后,我们进一步研究了人工智能模型运行时用水效率的独特时空多样性——用水效率随时间和地点的变化。这意味着通过在特定时间和特定地点动态调度人工智能工作负载和任务,有可能减少人工智能的水足迹,就像我们利用夜间的低电价为电动汽车充电来减少电费一样。


赛义德:这种水足迹与牛肉之类的东西相比如何?


任正非:我们可能从一些网站上看到,牛肉和牛仔裤的水足迹很大,但它们的水足迹是整个生命周期的,其中包括很大一部分非饮用水。例如,牛仔裤的水足迹始于棉花的生长。


在我们的研究中,我们只考虑运营水足迹(即与训练和运行人工智能模型相关的水消耗),而体现水足迹(例如与人工智能服务器制造和运输(包括芯片制造)相关的水足迹)被排除在外。如果我们考虑人工智能模型的具体水足迹,我的直觉是整体水足迹很容易增加 10 倍甚至更多。


赛义德:我特别好奇减少碳排放和节约用水可能如何相互矛盾。当你问我们是否应该“跟随或不跟随太阳”时,你的意思是什么?


任正非:水效率主要取决于外界温度以及发电的能源燃料组合。碳高效的时间/地点并不意味着节水的时间/地点,有时它们甚至是相反的。


具有节水意识的用户可能更喜欢在节水时间和/或节水数据中心使用人工智能模型的推理服务……。


例如,在加利福尼亚州,中午前后太阳能发电量较高,这导致碳效率最高的时间,但中午前后室外温度也很高,因此水效率最差。因此,如果我们只考虑减少碳足迹(例如,在中午左右安排更多的人工智能培训),我们最终可能会消耗更多的水,这对于人工智能来说并不真正可持续。


另一方面,如果我们只减少水足迹(例如,通过在午夜安排人工智能培训),我们可能会因为可用的太阳能减少而增加碳足迹。


赛义德:很明显,微软、谷歌和亚马逊等科技巨头对人工智能的未来下了很大的赌注,但我们是否看到他们将环境考虑作为其发展的优先事项?


任正非:是的,我们已经看到谷歌微软Meta等科技巨头的可持续发展报告中将水足迹列为优先考虑的问题。


此外,立法者最近开始考虑数据中心用水对当地环境的影响。例如,在弗吉尼亚州,劳登县被称为“世界数据中心之都”,今年年初提出的SB 1078法案将要求“进行现场评估……以检查数据中心对用水和碳排放的影响”排放以及对农业资源的影响。”


迄今为止,业界的大部分努力都集中在从“工程”角度提高现场用水效率,例如提高数据中心冷却塔效率和处理循环水,而不是利用当地的饮用水资源。尽管如此,绝大多数数据中心仍然使用饮用水和冷却塔。


例如,即使是谷歌这样的科技巨头也严重依赖冷却塔,每年消耗数十亿升的饮用水。


如此巨大的用水量给当地水利基础设施带来了压力;谷歌的数据中心使用了俄勒冈州达尔斯市四分之一以上的水。此外,许多数据中心还位于加利福尼亚州等干旱多发地区。


我们的研究表明,训练大型人工智能模型的“时间”和“地点”可以显着影响水足迹。


其根本原因是场内和场外用水效率(WUE)的时空多样性——场内WUE因外界天气条件的变化而变化,场外WUE因电网的变化而变化。能源燃料混合以满足随时间变化的需求。事实上,WUE 的变化速度比每月或季节性变化快得多。


因此,通过利用 WUE 的时空多样性,我们可以动态安排 AI 模型训练和推理,以减少水足迹。


例如,如果我们训练一个小型人工智能模型,我们可以将训练任务安排在午夜和/或水效率更高的数据中心位置。同样,一些注重水的用户可能更喜欢在节水时间和/或节水数据中心使用人工智能模型的推理服务,这有助于减少人工智能模型的推理水足迹。


这种需求侧水资源管理补充了现有的以供应侧为重点的基于工程的现场节水方法。此外,我们的方法是基于软件的,因此可以免费与任何冷却系统一起使用,对气候条件或新冷却系统安装没有特殊要求。


通过提高透明度,我们将能够准确地知道何时何地拥有最节水的人工智能模型。


赛义德:您提出透明度是有用的下一步。更高的透明度可以帮助我们回答哪些问题?


任正非:通过提高透明度,我们能够准确地知道何时何地拥有最节水的人工智能模型。


透明度还使得测量、基准测试和改善人工智能模型的水足迹成为可能,这对研究界具有巨大价值。目前,一些人工智能会议要求作者在论文中声明其人工智能模型的碳足迹;我们相信,凭借透明度和意识,作者还可以将其人工智能模型的水足迹声明为环境影响的一部分。


有了这些信息,人工智能模型开发人员可以更好地安排他们的人工智能模型训练,还可以利用时空多样性更好地路由用户的推理请求,以节省用水,而其他性能指标的退化几乎为零。


此外,透明度还可以让用户在运行时了解他们的水足迹,并更好地了解他们的水足迹(例如,如果可能的话,他们可能希望将一些非紧急的推理请求推迟到节水时间)。


苹果已将清洁能源调度融入其iPhone产品中,选择低碳时间进行充电,我们希望未来水感知的AI训练和推理也能变成现实。


我希望你和我一样觉得这发人深省!这件事尤其触动了我的心:我的父亲和姐姐都是水资源工程师,我在干旱的南加州长大。当然,我们正处于技术繁荣之中,但创新应该为我们的公共利益服务,而不是消灭它。


谢谢阅读!


总是,


纳比哈·赛义德


首席执行官


标记


纳比哈·赛义德


也发布 在这里


照片由David BeckerUnsplash上拍摄