Las ideas candentes sobre la inteligencia artificial están en todas partes: dependiendo de dónde se mire, la IA generativa nos matará, nos quitará el trabajo, nos liberará del trabajo pesado o estimulará una tremenda innovación. (De cualquier manera, los llamados a la regulación están aquí). En The Markup nos gusta adoptar un enfoque mesurado que a menudo incluye medir las consecuencias reales.
Por eso, estoy encantado de compartir estas preguntas y respuestas con el profesor asociado de ciencias de la computación de la Universidad de California en Riverside, Shaolei Ren , quien junto con su equipo, Riverside Ph.D. Los candidatos Pengfei Li y Jianyi Yang , y Mohammad A. Islam , profesor asociado de informática en la Universidad de Texas en Arlington, publicaron recientemente un artículo que cuantifica la huella hídrica secreta de la IA .
Si bien la huella de carbono de las tecnologías emergentes ha recibido cierta atención, para avanzar verdaderamente hacia la sostenibilidad, el agua también debe ser parte de la ecuación.
Además, ¡hola! Soy Nabiha Syed, directora ejecutiva de The Markup, y resulta que soy una persona que cree que el avance tecnológico puede coexistir con un planeta saludable, si lo convertimos en una prioridad. Continúe leyendo para saber cuánta agua podría “beber” una sola conversación de ChatGPT y los pasos tangibles que podemos tomar para reducir la huella hídrica de la IA.
(Estas preguntas y respuestas se han editado para mayor brevedad y claridad).
Syed: Con razón, estamos empezando a ver un mayor escrutinio de la huella de carbono de diversas tecnologías, incluidos los modelos de IA como GPT-3 y GPT-4, así como la minería de bitcoins . Pero su investigación se centra en algo que recibe menos atención: la huella hídrica secreta de la tecnología de inteligencia artificial. Cuéntanos tus hallazgos.
Ren: La huella hídrica ha pasado desapercibida por varias razones, incluida la gran percepción errónea de que el agua dulce es un recurso “infinito” y el precio relativamente más bajo del agua. Muchos desarrolladores de modelos de IA ni siquiera son conscientes de su huella hídrica. Pero esto no significa que la huella hídrica no sea importante, especialmente en regiones secas como California.
Junto con mis alumnos y mi colaborador en UT Arlington, investigué un poco sobre la huella hídrica de la IA utilizando una metodología de estimación de última generación. Descubrimos que los modelos de IA a gran escala son, de hecho, grandes consumidores de agua.
Por ejemplo, entrenar GPT-3 en los centros de datos de última generación de Microsoft en EE. UU. puede consumir directamente 700.000 litros de agua dulce limpia (suficiente para producir 370 automóviles BMW o 320 vehículos eléctricos Tesla), y el consumo de agua se habría triplicado si La capacitación se realizó en los centros de datos de Microsoft en Asia. Estas cifras no incluyen la huella hídrica fuera del sitio asociada con la generación de electricidad.
A modo de inferencia (es decir, conversación con ChatGPT), nuestra estimación muestra que ChatGPT necesita una botella de agua de 500 ml para una conversación breve de aproximadamente 20 a 50 preguntas y respuestas, dependiendo de cuándo y dónde se implemente el modelo. Dada la enorme base de usuarios de ChatGPT, la huella hídrica total para la inferencia puede ser enorme.
Luego, estudiamos más a fondo las diversidades espacio-temporales únicas de la eficiencia del agua en tiempo de ejecución de los modelos de IA: la eficiencia del agua cambia con el tiempo y según las ubicaciones. Esto implica que existe potencial para reducir la huella hídrica de la IA programando dinámicamente cargas de trabajo y tareas de IA en ciertos momentos y en ciertos lugares, de la misma manera que reducimos nuestras facturas de electricidad al utilizar los bajos precios de la electricidad durante la noche para cargar nuestros vehículos eléctricos.
Syed: ¿Cómo se compara esta huella hídrica con algo como, por ejemplo, la carne de res?
Ren: Es posible que veamos en algunos sitios web que la carne de res y los jeans tienen una gran huella hídrica, pero su huella hídrica es para todo el ciclo de vida e incluye una gran porción de agua no potable. Por ejemplo, la huella hídrica de los jeans comienza con el crecimiento del algodón.
En nuestro estudio, solo consideramos la huella hídrica operativa (es decir, el consumo de agua asociado con el entrenamiento y la ejecución de los modelos de IA), mientras que se excluye la huella hídrica incorporada (por ejemplo, la huella hídrica asociada con la fabricación y el transporte de servidores de IA, incluida la fabricación de chips). Si tenemos en cuenta la huella hídrica incorporada para los modelos de IA, mi intuición es que la huella hídrica general aumentaría fácilmente 10 veces o incluso más.
Syed: Tengo especial curiosidad por saber cómo la reducción de carbono y la conservación del agua podrían estar en tensión entre sí. ¿Qué quieres decir cuando preguntas si deberíamos “seguir o dejar de seguir al sol”?
Ren: La eficiencia del agua depende principalmente de la temperatura exterior, así como de las combinaciones de combustibles energéticos para la generación de electricidad. Las horas/ubicaciones eficientes en carbono no significan horas/ubicaciones eficientes en agua y, a veces, incluso son opuestas entre sí.
Los usuarios preocupados por el agua pueden preferir utilizar los servicios de inferencia de los modelos de IA durante horas de uso eficiente del agua y/o en centros de datos de uso eficiente del agua….
Por ejemplo, en California, hay una alta producción de energía solar alrededor del mediodía, y esto conduce a las horas más eficientes en carbono, pero alrededor del mediodía, la temperatura exterior también es alta y, por lo tanto, la eficiencia del agua es la peor. Como resultado, si solo consideramos la reducción de la huella de carbono (por ejemplo, programando más capacitación en IA alrededor del mediodía), probablemente terminaremos con un mayor consumo de agua, lo que no es realmente sostenible para la IA.
Por otro lado, si solo reducimos la huella hídrica (por ejemplo, programando entrenamiento de IA a medianoche), podemos aumentar la huella de carbono debido a la menor energía solar disponible.
Syed: Está claro que gigantes tecnológicos como Microsoft, Google y Amazon están apostando fuerte por el futuro de la IA, pero ¿estamos viendo que hacen de las consideraciones medioambientales una prioridad en su desarrollo?
Ren: Sí, hemos visto que la huella hídrica emerge como una prioridad en los informes de sostenibilidad de varios gigantes tecnológicos como Google , Microsoft y Meta .
Además, los legisladores han comenzado recientemente a considerar el impacto del uso del agua de los centros de datos en el medio ambiente local. Por ejemplo, en Virginia, donde el condado de Loudon es conocido como la “capital mundial de los centros de datos”, la SB 1078 , propuesta a principios de este año, requeriría “una evaluación del sitio... para examinar el efecto del centro de datos sobre el uso del agua y las emisiones de carbono”. emisiones, así como cualquier impacto en los recursos agrícolas”.
La mayoría de los esfuerzos de la industria hasta ahora se han centrado en mejorar la eficiencia del agua en sitio desde la perspectiva de "ingeniería", por ejemplo, mejorando la eficiencia de la torre de enfriamiento del centro de datos y procesando agua reciclada en lugar de aprovechar los recursos locales de agua potable. No obstante, la gran mayoría de los centros de datos todavía utilizan agua potable y torres de refrigeración.
Por ejemplo, incluso los gigantes tecnológicos como Google dependen en gran medida de torres de refrigeración y consumen miles de millones de litros de agua potable cada año.
Un consumo tan enorme de agua ha producido una tensión en la infraestructura hídrica local; El centro de datos de Google utilizó más de una cuarta parte de toda el agua en The Dalles, Oregon. Además, muchos centros de datos también están ubicados en áreas propensas a la sequía, como California.
Nuestro estudio muestra que "cuándo" y "dónde" entrenar un modelo de IA grande puede afectar significativamente la huella hídrica.
La razón subyacente es la diversidad espacio-temporal de la efectividad del uso del agua (WUE) tanto dentro como fuera del sitio: cambios de WUE en el sitio debido a variaciones de las condiciones climáticas exteriores y cambios de WUE fuera del sitio debido a variaciones de la red. mezclas de combustibles energéticos para satisfacer las demandas que varían en el tiempo. De hecho, la WUE varía a un ritmo mucho más rápido que mensual o estacionalmente.
Por lo tanto, al explotar la diversidad espacio-temporal de WUE, podemos programar dinámicamente el entrenamiento y la inferencia del modelo de IA para reducir la huella hídrica.
Por ejemplo, si entrenamos un modelo de IA pequeño, podemos programar la tarea de entrenamiento a medianoche y/o en la ubicación de un centro de datos con mejor eficiencia hídrica. Del mismo modo, algunos usuarios preocupados por el agua pueden preferir utilizar los servicios de inferencia de los modelos de IA durante horas de uso eficiente del agua y/o en centros de datos de uso eficiente del agua, lo que puede contribuir a la reducción de la huella hídrica de los modelos de IA para la inferencia.
Esta gestión del agua desde el lado de la demanda complementa los enfoques existentes de ahorro de agua in situ basados en ingeniería que se centran en el lado de la oferta. Además, nuestro enfoque está basado en software y, por lo tanto, se puede utilizar junto con cualquier sistema de refrigeración de forma gratuita, sin requisitos particulares en cuanto a las condiciones climáticas o la instalación de nuevos sistemas de refrigeración.
Al tener más transparencia, podríamos saber exactamente cuándo y dónde tenemos los modelos de IA con mayor eficiencia hídrica.
Syed: Usted propone la transparencia como un próximo paso útil. ¿Qué preguntas podría ayudarnos a responder una mayor transparencia?
Ren: Al tener más transparencia, podríamos saber exactamente cuándo y dónde tenemos los modelos de IA con mayor eficiencia hídrica.
La transparencia también permite medir, comparar y mejorar la huella hídrica de los modelos de IA, lo que puede ser de gran valor para la comunidad investigadora. Actualmente, algunas conferencias de IA han solicitado que los autores declaren la huella de carbono de sus modelos de IA en sus artículos; Creemos que con transparencia y conciencia, los autores también pueden declarar la huella hídrica de sus modelos de IA como parte del impacto ambiental.
Con dicha información, los desarrolladores de modelos de IA pueden programar mejor el entrenamiento de su modelo de IA y también explotar la diversidad espacio-temporal para enrutar mejor las solicitudes de inferencia de los usuarios para ahorrar agua con poca o ninguna degradación en otras métricas de rendimiento.
Además, la transparencia también puede permitir a los usuarios conocer su huella hídrica en tiempo de ejecución y mejorarla (por ejemplo, es posible que deseen aplazar algunas solicitudes de inferencia no urgentes a horas de uso eficiente del agua, si es posible).
Apple ha integrado la programación de energía limpia en sus productos iPhone seleccionando horas de carga con bajas emisiones de carbono, y esperamos que el entrenamiento y la inferencia de IA consciente del agua también se puedan convertir en realidad en el futuro.
¡Espero que esto te haya parecido tan estimulante como a mí! Esto me impactó especialmente: mi padre y mi hermana son ingenieros en recursos hídricos y yo crecí en el sur de California, asolado por la sequía. Sin duda estamos en un auge tecnológico, pero la innovación debe servir a nuestro bien público, no destruirlo.
¡Gracias por leer!
Siempre,
Nabiha Syed
Director ejecutivo
El marcado
Por Nabiha Syed
También publicado aquí
Foto de David Becker en Unsplash