paint-brush
La technologie IA et son empreinte hydrique secrètepar@TheMarkup
286 lectures

La technologie IA et son empreinte hydrique secrète

par The Markup7m2024/02/10
Read on Terminal Reader

Trop long; Pour lire

Bonjour aussi ! Je m'appelle Nabiha Syed, PDG de The Markup, et je suis une personne qui croit que le progrès technologique peut coexister avec une planète saine, si nous en faisons une priorité. Continuez à lire pour découvrir la quantité d’eau qu’une seule conversation ChatGPT pourrait « boire » et les mesures concrètes que nous pouvons prendre pour réduire l’empreinte hydrique de l’IA.
featured image - La technologie IA et son empreinte hydrique secrète
The Markup HackerNoon profile picture

Les nouvelles tendances en matière d’intelligence artificielle sont omniprésentes : selon l’endroit où l’on regarde, l’IA générative va soit nous tuer, soit nous faire perdre notre emploi, soit nous libérer de la corvée, soit stimuler une formidable innovation. (Quoi qu’il en soit, les appels à la réglementation sont ici.) Chez The Markup, nous aimons adopter une approche mesurée qui inclut souvent la mesure des conséquences réelles.


Je suis donc ravi de partager ces questions-réponses avec le professeur agrégé d'informatique à l'Université de Californie à Riverside, Shaolei Ren , qui, avec son équipe, Riverside Ph.D. les candidats Pengfei Li et Jianyi Yang , et Mohammad A. Islam , professeur agrégé d'informatique à l'Université du Texas à Arlington, ont récemment publié un article quantifiant l' empreinte hydrique secrète de l'IA .


Même si l’empreinte carbone des technologies émergentes a retenu l’attention, pour véritablement progresser vers la durabilité, l’eau doit également faire partie de l’équation.


Bonjour aussi ! Je m'appelle Nabiha Syed, PDG de The Markup, et je suis une personne qui croit que le progrès technologique peut coexister avec une planète saine, si nous en faisons une priorité. Continuez à lire pour découvrir la quantité d’eau qu’une seule conversation ChatGPT pourrait « boire » et les mesures concrètes que nous pouvons prendre pour réduire l’empreinte hydrique de l’IA.


(Cette question et réponse a été modifiée par souci de concision et de clarté.)

Légende : De gauche à droite : Pengfei Li, Jianyi Yang, Mohammad A. Islam, Shaolei Ren Crédit : Crédits, de gauche à droite : Qiuxiao Chen, UC Riverside, UT Arlington, UC Riverside

Syed : Pour de très bonnes raisons, nous commençons à observer une surveillance plus minutieuse de l'empreinte carbone de diverses technologies, y compris les modèles d'IA comme GPT-3 et GPT-4 ainsi que l'exploitation minière de bitcoins . Mais vos recherches se concentrent sur quelque chose qui reçoit moins d’attention : l’empreinte hydrique secrète de la technologie de l’IA. Parlez-nous de vos découvertes.


Ren : L'empreinte hydrique est restée inaperçue pour diverses raisons, notamment la perception erronée selon laquelle l'eau douce est une ressource « infinie » et le prix relativement bas de l'eau. De nombreux développeurs de modèles d’IA ne sont même pas conscients de leur empreinte hydrique. Mais cela ne veut pas dire que l’empreinte hydrique n’est pas importante, en particulier dans les régions touchées par la sécheresse comme la Californie.



Avec mes étudiants et mon collaborateur de l'UT Arlington, j'ai effectué des recherches sur l'empreinte eau de l'IA en utilisant une méthodologie d'estimation de pointe. Nous constatons que les modèles d’IA à grande échelle sont effectivement de gros consommateurs d’eau.


Par exemple, la formation GPT-3 dans les centres de données américains ultramodernes de Microsoft peut consommer directement 700 000 litres d'eau douce propre (assez pour produire 370 voitures BMW ou 320 véhicules électriques Tesla), et la consommation d'eau aurait été triplée si les formations ont été dispensées dans les centres de données Microsoft en Asie. Ces chiffres n’incluent pas l’empreinte eau hors site associée à la production d’électricité.


À des fins d'inférence (c'est-à-dire une conversation avec ChatGPT), notre estimation montre que ChatGPT a besoin d'une bouteille d'eau de 500 ml pour une courte conversation d'environ 20 à 50 questions et réponses, selon le moment et l'endroit où le modèle est déployé. Compte tenu de l’énorme base d’utilisateurs de ChatGPT, l’empreinte eau totale pour l’inférence peut être énorme.


Ensuite, nous avons étudié plus en détail les diversités spatio-temporelles uniques de l’efficacité de l’eau lors de l’exécution des modèles d’IA : l’efficacité de l’eau change avec le temps et selon les lieux. Cela implique qu'il est possible de réduire l'empreinte hydrique de l'IA en planifiant dynamiquement les charges de travail et les tâches de l'IA à certains moments et dans certains endroits, de la même manière que nous réduisons nos factures d'électricité en utilisant les bas prix de l'électricité pendant la nuit pour recharger nos véhicules électriques.


Syed : Comment cette empreinte eau se compare-t-elle à quelque chose comme, disons, le bœuf ?


Ren : Nous pouvons constater sur certains sites Web que le bœuf et les jeans ont une grande empreinte hydrique, mais leur empreinte hydrique s'étend sur l'ensemble du cycle de vie et comprend une grande partie de l'eau non potable. Par exemple, l’empreinte eau des jeans commence dès la croissance du coton.


Dans notre étude, nous considérons uniquement l'empreinte eau opérationnelle (c'est-à-dire la consommation d'eau associée à la formation et à l'exécution des modèles d'IA), tandis que l'empreinte eau intrinsèque (par exemple, l'empreinte eau associée à la fabrication et au transport des serveurs d'IA, y compris la fabrication de puces) est exclue. Si nous prenons en compte l’empreinte eau intrinsèque pour les modèles d’IA, mon intuition est que l’empreinte eau globale serait facilement multipliée par 10, voire plus.


Syed : Je suis particulièrement curieux de savoir comment la réduction des émissions de carbone et la conservation de l'eau pourraient être en tension les unes avec les autres. Que voulez-vous dire lorsque vous demandez si nous devrions « suivre ou ne plus suivre le soleil » ?


Ren : L'efficacité de l'eau dépend principalement de la température extérieure ainsi que des mix énergétiques pour la production d'électricité. Des horaires/lieux économes en carbone ne signifient pas des horaires/lieux économes en eau, et parfois ils sont même opposés les uns aux autres.


Les utilisateurs soucieux de l’eau peuvent préférer utiliser les services d’inférence des modèles d’IA pendant les heures économes en eau et/ou dans les centres de données économes en eau….


Par exemple, en Californie, il y a une forte production d'énergie solaire vers midi, ce qui conduit aux heures les plus économes en carbone, mais vers midi, la température extérieure est également élevée, et donc l'efficacité de l'eau est la pire. En conséquence, si l’on considère uniquement la réduction de l’empreinte carbone (par exemple, en programmant davantage de formations en IA vers midi), nous nous retrouverons probablement avec une consommation d’eau plus élevée, ce qui n’est pas vraiment durable pour l’IA.


D’un autre côté, si nous réduisons uniquement l’empreinte eau (par exemple en programmant une formation en IA à minuit), nous pourrions augmenter l’empreinte carbone en raison de la diminution de l’énergie solaire disponible.


Syed : Il est clair que les géants de la technologie comme Microsoft, Google et Amazon parient gros sur l'avenir de l'IA, mais les voyons-nous faire des considérations environnementales une priorité dans leur développement ?


Ren : Oui, nous avons vu l'empreinte eau émerger comme une priorité dans les rapports sur le développement durable de plusieurs géants de la technologie tels que Google , Microsoft et Meta .


En outre, les législateurs ont récemment commencé à considérer l'impact de la consommation d'eau des centres de données sur l'environnement local. Par exemple, en Virginie, où le comté de Loudon est connu comme la « capitale mondiale des centres de données », le SB 1078 , proposé au début de cette année, nécessiterait « une évaluation du site… pour examiner l'effet du centre de données sur la consommation d'eau et le carbone ». émissions ainsi que tout impact sur les ressources agricoles.


Jusqu'à présent, la plupart des efforts de l'industrie ont été concentrés sur l'amélioration de l'efficacité de l'eau sur site d'un point de vue « ingénierie », par exemple en améliorant l'efficacité de la tour de refroidissement du centre de données et en traitant l'eau recyclée au lieu d'exploiter les ressources locales en eau potable. Néanmoins, la grande majorité des centres de données utilisent encore de l’eau potable et des tours de refroidissement.


Par exemple, même les géants de la technologie comme Google dépendent fortement des tours de refroidissement et consomment des milliards de litres d’eau potable chaque année.


Une telle consommation d’eau énorme a mis à rude épreuve les infrastructures hydrauliques locales ; Le centre de données de Google a utilisé plus d'un quart de toute l'eau de The Dalles, dans l'Oregon. De plus, de nombreux centres de données sont également situés dans des zones sujettes à la sécheresse, comme la Californie.


Notre étude montre que « quand » et « où » entraîner un grand modèle d’IA peuvent affecter considérablement l’empreinte eau.


La raison sous-jacente est la diversité spatio-temporelle de l'efficacité de l'utilisation de l'eau (WUE) sur site et hors site : les changements de WUE sur site dus aux variations des conditions météorologiques extérieures et les changements de WUE hors site dus aux variations des variations du réseau. des mélanges de combustibles énergétiques pour répondre à des demandes variables dans le temps. En fait, le WUE varie beaucoup plus rapidement que mensuellement ou saisonnièrement.


Par conséquent, en exploitant la diversité spatio-temporelle de WUE, nous pouvons planifier dynamiquement la formation et l’inférence de modèles d’IA pour réduire l’empreinte eau.


Par exemple, si nous entraînons un petit modèle d’IA, nous pouvons planifier la tâche de formation à minuit et/ou dans un centre de données offrant une meilleure efficacité de l’eau. De même, certains utilisateurs soucieux de l'eau peuvent préférer utiliser les services d'inférence des modèles d'IA pendant les heures économes en eau et/ou dans des centres de données économes en eau, ce qui peut contribuer à la réduction de l'empreinte eau des modèles d'IA pour l'inférence.


Une telle gestion de l’eau axée sur la demande complète les approches d’économie d’eau sur site basées sur l’ingénierie et axées sur l’offre. De plus, notre approche est basée sur un logiciel et peut donc être utilisée gratuitement avec n'importe quel système de refroidissement sans exigences particulières concernant les conditions climatiques ou l'installation de nouveaux systèmes de refroidissement.


En ayant plus de transparence, nous serions en mesure de savoir exactement quand et où nous avons les modèles d'IA les plus économes en eau.


Syed : Vous proposez la transparence comme prochaine étape utile. À quelles questions une plus grande transparence pourrait-elle nous aider à répondre ?


Ren : En ayant plus de transparence, nous serions en mesure de savoir exactement quand et où nous avons les modèles d'IA les plus économes en eau.


La transparence permet également de mesurer, de comparer et d’améliorer l’empreinte eau des modèles d’IA, ce qui peut être d’une grande valeur pour la communauté des chercheurs. Actuellement, certaines conférences sur l'IA ont demandé aux auteurs de déclarer l'empreinte carbone de leurs modèles d'IA dans leurs articles ; nous pensons qu'avec transparence et sensibilisation, les auteurs peuvent également déclarer l'empreinte eau de leurs modèles d'IA comme faisant partie de l'impact environnemental.


Grâce à ces informations, les développeurs de modèles d'IA peuvent mieux planifier leur formation de modèle d'IA et également exploiter la diversité spatio-temporelle pour mieux acheminer les demandes d'inférence des utilisateurs afin d'économiser l'eau avec une dégradation faible, voire nulle, des autres mesures de performances.


De plus, la transparence peut également permettre aux utilisateurs de connaître leur empreinte eau au moment de l'exécution et d'améliorer leur empreinte eau (par exemple, ils pourraient vouloir reporter certaines demandes d'inférence non urgentes à des heures économes en eau si possible).


Apple a intégré la planification des énergies propres dans ses produits iPhone en sélectionnant des heures de chargement à faible émission de carbone, et nous espérons que la formation et l'inférence de l'IA tenant compte de l'eau pourront également devenir réalité à l'avenir.


J'espère que vous avez trouvé cela aussi stimulant que moi ! Celui-ci m'a particulièrement touché : mon père et ma sœur sont tous deux ingénieurs en ressources en eau, et j'ai grandi dans le sud de la Californie, ravagé par la sécheresse. Nous sommes certainement dans un boom technologique, mais l’innovation doit servir notre bien public, et non l’anéantir.


Merci d'avoir lu!


Toujours,


Nabiha Syed


Directeur général


Le balisage


Par Nabiha Syed


Également publié ici


Photo de David Becker sur Unsplash