As abordagens interessantes sobre a inteligência artificial estão por toda parte: dependendo de onde você olhar, a IA generativa nos matará, tomará nossos empregos, nos libertará do trabalho penoso ou estimulará uma tremenda inovação. (De qualquer forma, os apelos à regulamentação estão aqui.) Na The Markup, gostamos de adotar uma abordagem ponderada que muitas vezes inclui a medição das consequências reais.
Portanto, estou entusiasmado em compartilhar estas perguntas e respostas com o professor associado de ciência da computação da Universidade da Califórnia, Riverside, Shaolei Ren , que junto com sua equipe – Riverside Ph.D. os candidatos Pengfei Li e Jianyi Yang , e Mohammad A. Islam , professor associado de ciência da computação na Universidade do Texas em Arlington – publicaram recentemente um artigo quantificando a pegada hídrica secreta da IA .
Embora a pegada de carbono das tecnologias emergentes tenha recebido alguma atenção, para realmente construirmos em direção à sustentabilidade, a água também tem de fazer parte da equação.
Além disso, olá! Sou Nabiha Syed, CEO da The Markup, e sou uma pessoa que acredita que o avanço tecnológico pode coexistir com um planeta saudável – se fizermos disso uma prioridade. Continue lendo para saber quanta água uma única conversa do ChatGPT pode “beber” e as etapas tangíveis que podemos tomar para reduzir a pegada hídrica da IA.
(Estas perguntas e respostas foram editadas por questões de brevidade e clareza.)
Syed: Com uma boa razão, estamos começando a ver um maior escrutínio da pegada de carbono de várias tecnologias, incluindo modelos de IA como GPT‑3 e GPT‑4, bem como mineração de bitcoin . Mas a sua investigação centra-se em algo que recebe menos atenção: a pegada hídrica secreta da tecnologia de IA. Conte-nos sobre suas descobertas.
Ren: A pegada hídrica tem permanecido fora do radar por vários motivos, incluindo a grande percepção errada de que a água doce é um recurso “infinito” e o preço relativamente mais baixo da água. Muitos desenvolvedores de modelos de IA nem sequer estão conscientes da sua pegada hídrica. Mas isto não significa que a pegada hídrica não seja importante, especialmente em regiões secas como a Califórnia.
Juntamente com meus alunos e meu colaborador na UT Arlington, fiz algumas pesquisas sobre a pegada hídrica da IA usando metodologia de estimativa de última geração. Descobrimos que os modelos de IA em grande escala são de facto grandes consumidores de água.
Por exemplo, treinar GPT‑3 nos data centers de última geração da Microsoft nos EUA pode consumir diretamente 700.000 litros de água doce limpa (o suficiente para produzir 370 carros BMW ou 320 veículos elétricos Tesla), e o consumo de água teria sido triplicado se os treinamentos foram realizados nos data centers da Microsoft na Ásia. Estes números não incluem a pegada hídrica externa associada à geração de eletricidade.
Para inferência (ou seja, conversa com ChatGPT), nossa estimativa mostra que o ChatGPT precisa de uma garrafa de água de 500 ml para uma conversa curta de aproximadamente 20 a 50 perguntas e respostas, dependendo de quando e onde o modelo for implantado. Dada a enorme base de usuários do ChatGPT, a pegada hídrica total para inferência pode ser enorme.
Em seguida, estudamos ainda mais as diversidades espaço-temporais únicas da eficiência hídrica em tempo de execução dos modelos de IA – a eficiência hídrica muda ao longo do tempo e ao longo dos locais. Isto implica que há potencial para reduzir a pegada hídrica da IA, agendando dinamicamente cargas de trabalho e tarefas de IA em determinados momentos e em determinados locais, da mesma forma que reduzimos as nossas contas de eletricidade, utilizando os baixos preços da eletricidade durante a noite para carregar os nossos veículos elétricos.
Syed: Como essa pegada hídrica se compara a algo como, digamos, carne bovina?
Ren: Podemos ver em alguns sites que a carne bovina e o jeans têm uma grande pegada hídrica, mas sua pegada hídrica abrange todo o ciclo de vida e inclui uma grande porção de água não potável. Por exemplo, a pegada hídrica do jeans começa com o crescimento do algodão.
Em nosso estudo, consideramos apenas a pegada hídrica operacional (ou seja, o consumo de água associado ao treinamento e execução dos modelos de IA), enquanto a pegada hídrica incorporada (por exemplo, a pegada hídrica associada à fabricação e transporte de servidores de IA, incluindo fabricação de chips) é excluída. Se considerarmos a pegada hídrica incorporada nos modelos de IA, minha intuição é que a pegada hídrica geral aumentaria facilmente em 10 vezes ou até mais.
Syed: Estou particularmente curioso para saber como a redução de carbono e a conservação de água podem estar em conflito uma com a outra. O que você quer dizer quando pergunta se devemos “seguir ou deixar de seguir o sol”?
Ren: A eficiência hídrica depende principalmente da temperatura externa, bem como da mistura de combustíveis energéticos para geração de eletricidade. Horários/locais eficientes em carbono não significam horários/locais eficientes em termos de água e, às vezes, são até opostos entre si.
Os usuários preocupados com a água podem preferir usar os serviços de inferência dos modelos de IA durante horários com eficiência hídrica e/ou em data centers com eficiência hídrica….
Por exemplo, na Califórnia, há uma elevada produção de energia solar por volta do meio-dia, e isto leva a horas mais eficientes em termos de carbono, mas por volta do meio-dia, a temperatura exterior também é elevada e, portanto, a eficiência hídrica é pior. Como resultado, se considerarmos apenas a redução da pegada de carbono (digamos, agendando mais formação em IA por volta do meio-dia), provavelmente acabaremos com um maior consumo de água, o que não é verdadeiramente sustentável para a IA.
Por outro lado, se apenas reduzirmos a pegada hídrica (digamos, agendando a formação em IA à meia-noite), poderemos aumentar a pegada de carbono devido à menor disponibilidade de energia solar.
Syed: É claro que gigantes da tecnologia como a Microsoft, a Google e a Amazon estão a apostar alto no futuro da IA, mas estamos a vê-los tornar as considerações ambientais uma prioridade no seu desenvolvimento?
Ren: Sim, temos visto a pegada hídrica emergir como uma prioridade nos relatórios de sustentabilidade de vários gigantes da tecnologia, como Google , Microsoft e Meta .
Além disso, os legisladores começaram recentemente a considerar o impacto do uso da água pelos centros de dados no ambiente local. Por exemplo, na Virgínia, onde o condado de Loudon é conhecido como a “capital mundial dos data centers”, o SB 1078 , proposto no início deste ano, exigiria “uma avaliação do local… para examinar o efeito do data center no uso de água e nas emissões de carbono”. emissões, bem como quaisquer impactos nos recursos agrícolas.
A maior parte dos esforços da indústria até agora têm-se centrado na melhoria da eficiência hídrica no local a partir da perspectiva da “engenharia”, por exemplo, melhorando a eficiência da torre de arrefecimento do centro de dados e processando água reciclada em vez de explorar os recursos de água potável locais. No entanto, a grande maioria dos data centers ainda utiliza água potável e torres de resfriamento.
Por exemplo, mesmo gigantes da tecnologia como a Google dependem fortemente de torres de refrigeração e consomem milhares de milhões de litros de água potável todos os anos.
Este enorme consumo de água provocou uma pressão sobre a infra-estrutura hídrica local; O data center do Google usou mais de um quarto de toda a água em The Dalles, Oregon. Além disso, muitos data centers também estão localizados em áreas propensas à seca, como a Califórnia.
Nosso estudo mostra que “quando” e “onde” treinar um grande modelo de IA pode afetar significativamente a pegada hídrica.
A razão subjacente é a diversidade espaço-temporal da eficácia do uso da água (WUE) tanto no local quanto fora do local – mudanças na WUE no local devido a variações das condições climáticas externas e mudanças na WUE fora do local devido a variações na rede. misturas de energia e combustível para atender às demandas que variam no tempo. Na verdade, o WUE varia em uma escala de tempo muito mais rápida do que mensal ou sazonalmente.
Portanto, ao explorar a diversidade espaço-temporal do WUE, podemos agendar dinamicamente o treinamento e a inferência do modelo de IA para reduzir a pegada hídrica.
Por exemplo, se treinarmos um pequeno modelo de IA, podemos agendar a tarefa de treinamento à meia-noite e/ou em um data center com melhor eficiência hídrica. Da mesma forma, alguns utilizadores preocupados com a água podem preferir utilizar os serviços de inferência dos modelos de IA durante horários de consumo eficiente de água e/ou em centros de dados com consumo eficiente de água, o que pode contribuir para a redução da pegada hídrica dos modelos de IA para inferência.
Esta gestão da água do lado da procura complementa as abordagens existentes de poupança de água no local, baseadas na engenharia, que se concentram no lado da oferta. Além disso, a nossa abordagem é baseada em software e, portanto, pode ser usada gratuitamente em conjunto com qualquer sistema de refrigeração, sem requisitos específicos sobre as condições climáticas ou novas instalações de sistema de refrigeração.
Com mais transparência, seríamos capazes de saber exatamente quando e onde temos os modelos de IA mais eficientes em termos de consumo de água.
Syed: Você propõe a transparência como um próximo passo útil. Que perguntas uma maior transparência poderia nos ajudar a responder?
Ren: Com mais transparência, seríamos capazes de saber exatamente quando e onde temos os modelos de IA com maior eficiência hídrica.
A transparência também permite medir, comparar e melhorar a pegada hídrica dos modelos de IA, o que pode ser de grande valor para a comunidade científica. Atualmente, algumas conferências de IA solicitaram que os autores declarassem a pegada de carbono dos seus modelos de IA nos seus artigos; acreditamos que com transparência e consciência, os autores também podem declarar a pegada hídrica dos seus modelos de IA como parte do impacto ambiental.
Com essas informações, os desenvolvedores de modelos de IA podem programar melhor o treinamento do modelo de IA e também explorar a diversidade espaço-temporal para melhor encaminhar as solicitações de inferência dos usuários para economizar água com pouca ou nenhuma degradação em outras métricas de desempenho.
Além disso, a transparência também pode permitir que os usuários conheçam sua pegada hídrica em tempo de execução e melhorem sua pegada hídrica (por exemplo, eles podem querer adiar algumas solicitações de inferência não urgentes para horários com eficiência hídrica, se possível).
A Apple integrou o agendamento de energia limpa em seus produtos iPhone, selecionando horas de baixo carbono para carregamento, e esperamos que o treinamento e a inferência de IA conscientes da água também possam se tornar realidade no futuro.
Espero que você tenha achado isso tão instigante quanto eu! Este atingiu especialmente perto de casa: meu pai e minha irmã são engenheiros de recursos hídricos e eu cresci no sul da Califórnia, assolado pela seca. Estamos num boom tecnológico, sem dúvida, mas a inovação deve servir o nosso bem público e não eliminá-lo.
Obrigado por ler!
Sempre,
Nabiha Syed
Diretor Executivo
A marcação
Por Nabiha Syed
Também publicado aqui
Foto de David Becker no Unsplash