कृत्रिम बुद्धिमत्ता पर हॉट टेक हर जगह हैं: आप जहां देखते हैं उसके आधार पर, जेनरेटिव एआई या तो हमें मार डालेगी, हमारी नौकरियां ले लेगी, हमें कठिन परिश्रम से मुक्त कर देगी, या जबरदस्त नवाचार को बढ़ावा देगी। (किसी भी तरह से, विनियमन की मांगें यहां हैं।) मार्कअप में हम एक मापा दृष्टिकोण अपनाना पसंद करते हैं जिसमें अक्सर, वास्तविक परिणामों को मापना भी शामिल होता है।
इसलिए मैं इस प्रश्नोत्तरी को कैलिफोर्निया विश्वविद्यालय, रिवरसाइड में कंप्यूटर विज्ञान के एसोसिएट प्रोफेसर, शाओली रेन के साथ साझा करने के लिए रोमांचित हूं, जिन्होंने अपनी टीम-रिवरसाइड पीएच.डी. के साथ मिलकर काम किया है। उम्मीदवार पेंगफेई ली और जियानयी यांग , और आर्लिंगटन में टेक्सास विश्वविद्यालय में कंप्यूटर विज्ञान के एसोसिएट प्रोफेसर मोहम्मद ए. इस्लाम ने हाल ही में एआई के गुप्त जल पदचिह्न को मापने वाला एक पेपर प्रकाशित किया है।
जबकि उभरती प्रौद्योगिकियों के कार्बन पदचिह्न पर कुछ ध्यान दिया गया है, वास्तव में स्थिरता की ओर बढ़ने के लिए, पानी को भी समीकरण का हिस्सा होना चाहिए।
साथ ही, नमस्कार! मैं नबीहा सैयद, द मार्कअप की सीईओ हूं, और मैं एक ऐसा व्यक्ति हूं जो मानता है कि तकनीकी प्रगति एक स्वस्थ ग्रह के साथ सह-अस्तित्व में रह सकती है - अगर हम इसे प्राथमिकता दें। यह जानने के लिए पढ़ते रहें कि एक चैटजीपीटी वार्तालाप कितना पानी "पी सकता है" और एआई के जल पदचिह्न को कम करने के लिए हम ठोस कदम उठा सकते हैं।
(यह प्रश्नोत्तर संक्षिप्तता और स्पष्टता के लिए संपादित किया गया है।)
सैयद: बहुत अच्छे कारण के साथ, हम विभिन्न प्रौद्योगिकियों के कार्बन पदचिह्न की अधिक जांच देखना शुरू कर रहे हैं, जिसमें जीपीटी‑3 और जीपीटी‑4 जैसे एआई मॉडल के साथ-साथ बिटकॉइन खनन भी शामिल है। लेकिन आपका शोध उस चीज़ पर केंद्रित है जिस पर कम ध्यान दिया जा रहा है: एआई तकनीक का गुप्त जल पदचिह्न। हमें अपने निष्कर्षों के बारे में बताएं.
रेन: जल पदचिह्न विभिन्न कारणों से रडार के नीचे रहा है, जिसमें बड़ी गलत धारणा भी शामिल है कि मीठा पानी एक "अनंत" संसाधन है और पानी की अपेक्षाकृत कम कीमत है। कई एआई मॉडल डेवलपर्स को अपने जल पदचिह्न के बारे में भी पता नहीं है। लेकिन इसका मतलब यह नहीं है कि जल पदचिह्न महत्वपूर्ण नहीं है, खासकर कैलिफ़ोर्निया जैसे सूखे क्षेत्रों में।
यूटी आर्लिंगटन में अपने छात्रों और अपने सहयोगियों के साथ, मैंने अत्याधुनिक आकलन पद्धति का उपयोग करके एआई के जल पदचिह्न पर कुछ शोध किया। हमने पाया कि बड़े पैमाने के एआई मॉडल वास्तव में बड़े जल उपभोक्ता हैं।
उदाहरण के लिए, माइक्रोसॉफ्ट के अत्याधुनिक अमेरिकी डेटा केंद्रों में GPT‑3 का प्रशिक्षण सीधे 700,000 लीटर स्वच्छ मीठे पानी (370 बीएमडब्ल्यू कारों या 320 टेस्ला इलेक्ट्रिक वाहनों के उत्पादन के लिए पर्याप्त) की खपत कर सकता है, और अगर पानी की खपत तीन गुना हो जाती प्रशिक्षण एशिया में माइक्रोसॉफ्ट के डेटा केंद्रों में किया गया। इन आंकड़ों में बिजली उत्पादन से जुड़े ऑफ-साइट जल पदचिह्न शामिल नहीं हैं।
अनुमान के लिए (यानी, चैटजीपीटी के साथ बातचीत), हमारे अनुमान से पता चलता है कि चैटजीपीटी को लगभग 20 से 50 प्रश्नों और उत्तरों की एक छोटी बातचीत के लिए 500 मिलीलीटर पानी की बोतल की आवश्यकता होती है, यह इस बात पर निर्भर करता है कि मॉडल कब और कहाँ तैनात किया गया है। चैटजीपीटी के विशाल उपयोगकर्ता आधार को देखते हुए, अनुमान के लिए कुल जल पदचिह्न बहुत बड़ा हो सकता है।
फिर, हमने एआई मॉडल की रनटाइम जल दक्षता की अद्वितीय स्थानिक-लौकिक विविधताओं का अध्ययन किया- जल दक्षता समय और स्थानों के साथ बदलती है। इसका तात्पर्य यह है कि निश्चित समय और निश्चित स्थानों पर एआई वर्कलोड और कार्यों को गतिशील रूप से शेड्यूल करके एआई के जल पदचिह्न को कम करने की क्षमता है, जिस तरह से हम अपने इलेक्ट्रिक वाहनों को चार्ज करने के लिए रात के दौरान कम बिजली की कीमतों का उपयोग करके अपने बिजली बिल को कम करते हैं।
सैयद: इस जल पदचिह्न की तुलना गोमांस जैसी किसी चीज़ से कैसे की जाती है?
रेन: हम कुछ वेबसाइटों से देख सकते हैं कि गोमांस और जींस में एक बड़ा जल पदचिह्न है, लेकिन उनका जल पदचिह्न पूरे जीवन चक्र के लिए है और इसमें गैर-पीने योग्य पानी का एक बड़ा हिस्सा शामिल है। उदाहरण के लिए, जींस का जल पदचिह्न कपास की वृद्धि से शुरू होता है।
हमारे अध्ययन में, हम केवल परिचालन जल पदचिह्न (यानी, प्रशिक्षण और एआई मॉडल चलाने से जुड़ी पानी की खपत) पर विचार करते हैं, जबकि सन्निहित जल पदचिह्न (उदाहरण के लिए, चिप निर्माण सहित एआई सर्वर निर्माण और परिवहन से जुड़े जल पदचिह्न) को बाहर रखा गया है। यदि हम एआई मॉडल के लिए सन्निहित जल पदचिह्न को ध्यान में रखते हैं, तो मेरी आंतरिक भावना यह है कि समग्र जल पदचिह्न आसानी से 10 गुना या उससे भी अधिक बढ़ जाएगा।
सैयद: मैं विशेष रूप से इस बात को लेकर उत्सुक हूं कि कार्बन कटौती और जल संरक्षण एक दूसरे के साथ कैसे तनावपूर्ण हो सकते हैं। जब आप पूछते हैं कि क्या हमें "सूर्य का अनुसरण करना चाहिए या उसका अनुसरण नहीं करना चाहिए" तो आपका क्या मतलब है?
रेन: जल दक्षता ज्यादातर बाहरी तापमान के साथ-साथ बिजली उत्पादन के लिए ऊर्जा ईंधन मिश्रण पर निर्भर करती है। कार्बन-कुशल घंटे/स्थानों का मतलब जल-कुशल घंटे/स्थान नहीं है, और कभी-कभी वे एक-दूसरे के विपरीत भी होते हैं।
जल के प्रति जागरूक उपयोगकर्ता जल-कुशल घंटों के दौरान और/या जल-कुशल डेटा केंद्रों में एआई मॉडल की अनुमान सेवाओं का उपयोग करना पसंद कर सकते हैं…।
उदाहरण के लिए, कैलिफ़ोर्निया में, दोपहर के आसपास सौर ऊर्जा का उच्च उत्पादन होता है, और इससे सबसे अधिक कार्बन-कुशल घंटे होते हैं, लेकिन दोपहर के आसपास, बाहरी तापमान भी अधिक होता है, और इसलिए जल दक्षता सबसे खराब होती है। परिणामस्वरूप, यदि हम केवल कार्बन फ़ुटप्रिंट में कमी पर विचार करते हैं (मान लीजिए, दोपहर के आसपास अधिक एआई प्रशिक्षण निर्धारित करके), तो हम संभवतः अधिक पानी की खपत के साथ समाप्त हो जाएंगे, जो वास्तव में एआई के लिए टिकाऊ नहीं है।
दूसरी ओर, यदि हम केवल जल पदचिह्न को कम करते हैं (मान लीजिए, आधी रात को एआई प्रशिक्षण का समय निर्धारित करके), तो हम कम सौर ऊर्जा उपलब्ध होने के कारण कार्बन पदचिह्न को बढ़ा सकते हैं।
सैयद: यह स्पष्ट है कि माइक्रोसॉफ्ट, गूगल और अमेज़ॅन जैसे तकनीकी दिग्गज एआई के भविष्य पर बड़ा दांव लगा रहे हैं, लेकिन क्या हम उन्हें अपने विकास में पर्यावरणीय विचारों को प्राथमिकता देते हुए देख रहे हैं?
रेन: हाँ, हम Google , Microsoft और Meta जैसे कई तकनीकी दिग्गजों की स्थिरता रिपोर्ट में जल पदचिह्न को प्राथमिकता के रूप में उभरते हुए देख रहे हैं।
साथ ही, विधायकों ने हाल ही में स्थानीय पर्यावरण पर डेटा केंद्रों के पानी के उपयोग के प्रभाव पर विचार करना शुरू कर दिया है। उदाहरण के लिए, वर्जीनिया में, जहां लाउडन काउंटी को "दुनिया की डेटा सेंटर राजधानी" के रूप में जाना जाता है, इस साल की शुरुआत में प्रस्तावित एसबी 1078 को पानी के उपयोग और कार्बन पर डेटा सेंटर के प्रभाव की जांच करने के लिए "एक साइट मूल्यांकन ..." की आवश्यकता होगी। उत्सर्जन के साथ-साथ कृषि संसाधनों पर कोई प्रभाव।"
अब तक उद्योग के अधिकांश प्रयास "इंजीनियरिंग" परिप्रेक्ष्य से ऑन-साइट जल दक्षता में सुधार लाने पर केंद्रित रहे हैं, उदाहरण के लिए, डेटा सेंटर की कूलिंग टॉवर दक्षता में सुधार करना और स्थानीय पीने योग्य जल संसाधनों में दोहन के बजाय पुनर्नवीनीकरण पानी का प्रसंस्करण करना। बहरहाल, अधिकांश डेटा केंद्र अभी भी पीने योग्य पानी और कूलिंग टावरों का उपयोग करते हैं।
उदाहरण के लिए, Google जैसे तकनीकी दिग्गज भी कूलिंग टावरों पर बहुत अधिक निर्भर हैं और हर साल अरबों लीटर पीने योग्य पानी की खपत करते हैं।
पानी की इतनी बड़ी खपत ने स्थानीय जल बुनियादी ढांचे पर दबाव पैदा कर दिया है; Google के डेटा सेंटर ने द डेल्स, ओरे में एक चौथाई से अधिक पानी का उपयोग किया। इसके अलावा, कई डेटा सेंटर कैलिफोर्निया जैसे सूखाग्रस्त क्षेत्रों में भी स्थित हैं।
हमारे अध्ययन से पता चलता है कि एक बड़े एआई मॉडल को प्रशिक्षित करने के लिए "कब" और "कहां" जल पदचिह्न को महत्वपूर्ण रूप से प्रभावित कर सकता है।
अंतर्निहित कारण ऑन-साइट और ऑफ-साइट जल उपयोग प्रभावशीलता (डब्ल्यूयूई) दोनों की स्थानिक-लौकिक विविधता है - बाहरी मौसम की स्थिति में बदलाव के कारण ऑन-साइट डब्ल्यूयूई परिवर्तन, और ग्रिड की विविधता के कारण ऑफ-साइट डब्ल्यूयूई परिवर्तन। समय-समय पर बदलती मांगों को पूरा करने के लिए ऊर्जा ईंधन मिश्रण। वास्तव में, WUE मासिक या मौसमी की तुलना में बहुत तेजी से बदलता रहता है।
इसलिए, WUE की स्थानिक-लौकिक विविधता का दोहन करके, हम जल पदचिह्न में कटौती के लिए AI मॉडल प्रशिक्षण और अनुमान को गतिशील रूप से शेड्यूल कर सकते हैं।
उदाहरण के लिए, यदि हम एक छोटे एआई मॉडल को प्रशिक्षित करते हैं, तो हम आधी रात को और/या बेहतर जल दक्षता वाले डेटा सेंटर स्थान पर प्रशिक्षण कार्य निर्धारित कर सकते हैं। इसी तरह, कुछ जल-सचेत उपयोगकर्ता जल-कुशल घंटों के दौरान और/या जल-कुशल डेटा केंद्रों में एआई मॉडल की अनुमान सेवाओं का उपयोग करना पसंद कर सकते हैं, जो अनुमान के लिए एआई मॉडल के जल पदचिह्न को कम करने में योगदान कर सकते हैं।
इस तरह का मांग-पक्ष जल प्रबंधन मौजूदा इंजीनियरिंग-आधारित ऑन-साइट जल-बचत दृष्टिकोण का पूरक है जो आपूर्ति पक्ष पर ध्यान केंद्रित करता है। इसके अलावा, हमारा दृष्टिकोण सॉफ्टवेयर-आधारित है और इसलिए इसे जलवायु स्थितियों या नए कूलिंग सिस्टम इंस्टॉलेशन पर विशेष आवश्यकताओं के बिना किसी भी कूलिंग सिस्टम के साथ मुफ्त में उपयोग किया जा सकता है।
अधिक पारदर्शिता होने से, हम यह जान पाएंगे कि हमारे पास सबसे अधिक जल-कुशल एआई मॉडल कब और कहाँ हैं।
सैयद: आप अगले सहायक कदम के रूप में पारदर्शिता का प्रस्ताव करते हैं। अधिक पारदर्शिता हमें किन सवालों के जवाब देने में मदद कर सकती है?
रेन: अधिक पारदर्शिता होने से, हम यह जान पाएंगे कि हमारे पास सबसे अधिक जल-कुशल एआई मॉडल कब और कहाँ हैं।
पारदर्शिता एआई मॉडल के जल पदचिह्न को मापना, बेंचमार्क करना और सुधारना भी संभव बनाती है, जो अनुसंधान समुदाय के लिए बहुत महत्वपूर्ण हो सकता है। वर्तमान में, कुछ एआई सम्मेलनों ने अनुरोध किया है कि लेखक अपने एआई मॉडल के कार्बन पदचिह्न को अपने पत्रों में घोषित करें; हमारा मानना है कि पारदर्शिता और जागरूकता के साथ, लेखक अपने एआई मॉडल के जल पदचिह्न को पर्यावरणीय प्रभाव के हिस्से के रूप में भी घोषित कर सकते हैं।
ऐसी जानकारी के साथ, एआई मॉडल डेवलपर्स अपने एआई मॉडल प्रशिक्षण को बेहतर ढंग से शेड्यूल कर सकते हैं और अन्य प्रदर्शन मेट्रिक्स में कम से शून्य गिरावट के साथ पानी बचाने के लिए उपयोगकर्ताओं के अनुमान अनुरोधों को बेहतर ढंग से रूट करने के लिए स्थानिक-लौकिक विविधता का भी फायदा उठा सकते हैं।
इसके अतिरिक्त, पारदर्शिता उपयोगकर्ताओं को रनटाइम के दौरान उनके जल पदचिह्न के बारे में भी बता सकती है और उनके जल पदचिह्न को बेहतर कर सकती है (मान लीजिए, यदि संभव हो तो वे जल-कुशल घंटों के लिए कुछ गैर-जरूरी अनुमान अनुरोधों को स्थगित करना चाह सकते हैं)।
Apple ने चार्जिंग के लिए कम कार्बन वाले घंटों का चयन करके अपने iPhone उत्पादों में स्वच्छ ऊर्जा शेड्यूलिंग को एकीकृत किया है, और हमें उम्मीद है कि भविष्य में जल-जागरूक AI प्रशिक्षण और अनुमान को भी वास्तविकता में बदला जा सकता है।
मुझे आशा है कि आपको यह मेरी तरह ही विचारोत्तेजक लगा होगा! यह विशेष रूप से घर के नजदीक हिट हुआ: मेरे पिता और बहन दोनों जल संसाधन इंजीनियर हैं, और मैं सूखाग्रस्त दक्षिणी कैलिफोर्निया में पला-बढ़ा हूं। हम निश्चित रूप से एक तकनीकी उछाल में हैं - लेकिन नवाचार को हमारी जनता की भलाई के लिए काम करना चाहिए, न कि इसे नष्ट करना चाहिए।
पढ़ने के लिए धन्यवाद!
हमेशा,
नबीहा सैयद
मुख्य कार्यकारी अधिकारी
मार्कअप
नबीहा सैयद द्वारा
यहाँ भी प्रकाशित किया गया
अनस्प्लैश पर डेविड बेकर द्वारा फोटो