paint-brush
Công nghệ AI và dấu chân nước bí mật của nótừ tác giả@TheMarkup
286 lượt đọc

Công nghệ AI và dấu chân nước bí mật của nó

từ tác giả The Markup7m2024/02/10
Read on Terminal Reader

dài quá đọc không nổi

Ngoài ra, xin chào! Tôi là Nabiha Syed, Giám đốc điều hành của The Markup và tôi là người tin rằng tiến bộ công nghệ có thể cùng tồn tại với một hành tinh khỏe mạnh — nếu chúng ta ưu tiên điều đó. Hãy tiếp tục đọc để tìm hiểu xem một cuộc trò chuyện ChatGPT có thể “uống” bao nhiêu nước và các bước hữu hình mà chúng ta có thể thực hiện để giảm lượng nước tiêu thụ của AI.
featured image - Công nghệ AI và dấu chân nước bí mật của nó
The Markup HackerNoon profile picture

Trí tuệ nhân tạo đang được ưa chuộng ở khắp mọi nơi: Tùy thuộc vào nơi bạn nhìn, AI có tính sáng tạo sẽ giết chết chúng ta, cướp đi công việc của chúng ta, giải phóng chúng ta khỏi công việc cực nhọc hoặc thúc đẩy sự đổi mới to lớn. (Dù thế nào đi nữa, những lời kêu gọi về quy định đều có ở đây.) Tại The Markup, chúng tôi muốn thực hiện một cách tiếp cận đo lường thường bao gồm cả việc đo lường các hậu quả thực tế.


Vì vậy, tôi rất vui được chia sẻ phần Hỏi & Đáp này với phó giáo sư khoa học máy tính tại Đại học California, Riverside, Shaolei Ren , người cùng với nhóm của mình—Riverside Ph.D. các ứng cử viên Pengfei LiJianyi Yang , và Mohammad A. Islam , phó giáo sư khoa học máy tính tại Đại học Texas ở Arlington—gần đây đã xuất bản một bài báo định lượng dấu chân nước bí mật của AI .


Mặc dù lượng khí thải carbon của các công nghệ mới nổi đã nhận được một số sự chú ý nhưng để thực sự xây dựng hướng tới sự bền vững, nước cũng phải là một phần của phương trình.


Ngoài ra, xin chào! Tôi là Nabiha Syed, Giám đốc điều hành của The Markup và tôi là người tin rằng tiến bộ công nghệ có thể cùng tồn tại với một hành tinh khỏe mạnh—nếu chúng ta ưu tiên điều đó. Hãy tiếp tục đọc để tìm hiểu xem một cuộc trò chuyện ChatGPT có thể “uống” bao nhiêu nước và các bước hữu hình mà chúng ta có thể thực hiện để giảm lượng nước tiêu thụ của AI.


(Phần Hỏi & Đáp này đã được chỉnh sửa để ngắn gọn và rõ ràng.)

Chú thích: Từ trái sang phải: Pengfei Li, Jianyi Yang, Mohammad A. Islam, Shaolei Ren Nguồn: Nguồn, từ trái sang phải: Qiuxiao Chen, UC Riverside, UT Arlington, UC Riverside

Syed: Với lý do rất chính đáng, chúng tôi bắt đầu thấy sự xem xét kỹ lưỡng hơn về lượng khí thải carbon của các công nghệ khác nhau, bao gồm các mô hình AI như GPT‑3 và GPT‑4 cũng như khai thác bitcoin . Nhưng nghiên cứu của bạn tập trung vào một thứ ít được chú ý hơn: dấu chân nước bí mật của công nghệ AI. Hãy cho chúng tôi biết về những phát hiện của bạn.


Ren: Dấu chân nước vẫn chưa được chú ý vì nhiều lý do, bao gồm cả nhận thức sai lầm lớn rằng nước ngọt là nguồn tài nguyên “vô hạn” và giá nước tương đối thấp. Nhiều nhà phát triển mô hình AI thậm chí không nhận thức được dấu chân nước của họ. Nhưng điều này không có nghĩa là dấu chân nước không quan trọng, đặc biệt là ở những vùng hạn hán như California.



Cùng với các sinh viên và cộng tác viên của tôi tại UT Arlington, tôi đã thực hiện một số nghiên cứu về dấu chân nước của AI bằng phương pháp ước tính hiện đại. Chúng tôi nhận thấy rằng các mô hình AI quy mô lớn thực sự tiêu thụ nhiều nước.


Ví dụ: đào tạo GPT‑3 trong các trung tâm dữ liệu hiện đại của Microsoft tại Hoa Kỳ có thể tiêu thụ trực tiếp 700.000 lít nước ngọt sạch (đủ để sản xuất 370 ô tô BMW hoặc 320 xe điện Tesla) và lượng nước tiêu thụ sẽ tăng gấp ba nếu đào tạo được thực hiện tại các trung tâm dữ liệu của Microsoft ở Châu Á. Những con số này không bao gồm lượng nước thải bên ngoài khu vực liên quan đến sản xuất điện.


Để suy luận (tức là trò chuyện với ChatGPT), ước tính của chúng tôi cho thấy ChatGPT cần một chai nước 500 ml cho một cuộc trò chuyện ngắn khoảng 20 đến 50 câu hỏi và câu trả lời, tùy thuộc vào thời điểm và địa điểm mô hình được triển khai. Với cơ sở người dùng khổng lồ của ChatGPT, tổng lượng nước tiêu tốn cho việc suy luận có thể rất lớn.


Sau đó, chúng tôi nghiên cứu sâu hơn về tính đa dạng về không gian-thời gian độc đáo của hiệu quả sử dụng nước trong thời gian chạy của mô hình AI—hiệu quả sử dụng nước thay đổi theo thời gian và theo địa điểm. Điều này ngụ ý rằng có khả năng giảm lượng nước tiêu thụ của AI bằng cách lên lịch linh hoạt khối lượng công việc và nhiệm vụ AI vào những thời điểm nhất định và ở những địa điểm nhất định, giống như cách chúng ta giảm hóa đơn tiền điện bằng cách tận dụng giá điện thấp vào ban đêm để sạc cho xe điện.


Syed: Dấu chân nước này so với thứ gì đó như thịt bò chẳng hạn như thế nào?


Ren: Chúng ta có thể thấy từ một số trang web rằng thịt bò và quần jean có lượng nước lớn, nhưng lượng nước của chúng là trong toàn bộ vòng đời và bao gồm một phần lớn nước không thể uống được. Ví dụ, dấu chân nước của quần jean bắt đầu từ sự phát triển của bông.


Trong nghiên cứu của chúng tôi, chúng tôi chỉ xem xét dấu chân nước hoạt động (tức là mức tiêu thụ nước liên quan đến đào tạo và chạy các mô hình AI), trong khi dấu chân nước hiện tại (ví dụ: dấu chân nước liên quan đến sản xuất và vận chuyển máy chủ AI, bao gồm cả sản xuất chip) bị loại trừ. Nếu chúng ta tính đến dấu chân nước hiện có cho các mô hình AI, tôi có cảm giác rằng tổng dấu chân nước sẽ dễ dàng tăng lên gấp 10 lần hoặc thậm chí hơn.


Syed: Tôi đặc biệt tò mò về việc giảm lượng carbon và bảo tồn nước có thể mâu thuẫn với nhau như thế nào. Ý bạn là gì khi hỏi chúng ta nên “đi theo hay bỏ theo dõi mặt trời”?


Ren: Hiệu quả sử dụng nước chủ yếu phụ thuộc vào nhiệt độ bên ngoài cũng như hỗn hợp nhiên liệu năng lượng để phát điện. Giờ/địa điểm tiết kiệm carbon không có nghĩa là giờ/địa điểm tiết kiệm nước và đôi khi chúng thậm chí còn đối lập nhau.


Người dùng quan tâm đến nước có thể thích sử dụng dịch vụ suy luận của mô hình AI trong những giờ tiết kiệm nước và/hoặc trong các trung tâm dữ liệu tiết kiệm nước….


Ví dụ, ở California, năng lượng mặt trời được sản xuất nhiều vào khoảng giữa trưa và điều này dẫn đến những giờ tiết kiệm carbon nhất, nhưng vào khoảng giữa trưa, nhiệt độ bên ngoài cũng cao và do đó hiệu quả sử dụng nước là kém nhất. Kết quả là, nếu chúng ta chỉ xem xét việc giảm lượng khí thải carbon (giả sử bằng cách lên lịch đào tạo AI nhiều hơn vào buổi trưa), chúng ta có thể sẽ tiêu thụ nhiều nước hơn, điều này không thực sự bền vững cho AI.


Mặt khác, nếu chúng ta chỉ giảm lượng nước thải (chẳng hạn bằng cách lên lịch đào tạo AI vào lúc nửa đêm), chúng ta có thể tăng lượng khí thải carbon do có ít năng lượng mặt trời hơn.


Syed: Rõ ràng là những gã khổng lồ công nghệ như Microsoft, Google và Amazon đang đặt cược lớn vào tương lai của AI, nhưng chúng ta có thấy họ ưu tiên cân nhắc về môi trường trong quá trình phát triển của mình không?


Ren: Đúng vậy, chúng tôi nhận thấy dấu chân nước là ưu tiên hàng đầu trong các báo cáo phát triển bền vững của một số gã khổng lồ công nghệ như Google , MicrosoftMeta .


Ngoài ra, các nhà lập pháp gần đây đã bắt đầu xem xét tác động của việc sử dụng nước của các trung tâm dữ liệu đối với môi trường địa phương. Ví dụ: ở Virginia, nơi Quận Loudon được mệnh danh là “thủ đô trung tâm dữ liệu của thế giới”, SB 1078 , được đề xuất vào đầu năm nay, sẽ yêu cầu “đánh giá địa điểm… để kiểm tra tác động của trung tâm dữ liệu đối với việc sử dụng nước và carbon”. lượng khí thải cũng như bất kỳ tác động nào đến tài nguyên nông nghiệp.”


Hầu hết các nỗ lực của ngành cho đến nay đều tập trung vào việc cải thiện hiệu quả sử dụng nước tại chỗ từ góc độ “kỹ thuật”, ví dụ: cải thiện hiệu quả của tháp giải nhiệt của trung tâm dữ liệu và xử lý nước tái chế thay vì khai thác nguồn nước uống được tại địa phương. Tuy nhiên, phần lớn các trung tâm dữ liệu vẫn sử dụng nước uống và tháp giải nhiệt.


Ví dụ, ngay cả những gã khổng lồ công nghệ như Google cũng phụ thuộc rất nhiều vào tháp giải nhiệt và tiêu thụ hàng tỷ lít nước uống được mỗi năm.


Mức tiêu thụ nước lớn như vậy đã tạo ra áp lực lên cơ sở hạ tầng nước ở địa phương; Trung tâm dữ liệu của Google đã sử dụng hơn 1/4 tổng lượng nước ở The Dalles, Ore. Hơn nữa, nhiều trung tâm dữ liệu cũng được đặt tại những khu vực hay bị hạn hán như California.


Nghiên cứu của chúng tôi cho thấy rằng “khi nào” và “ở đâu” để đào tạo một mô hình AI lớn có thể ảnh hưởng đáng kể đến dấu chân nước.


Lý do cơ bản là sự đa dạng về không gian-thời gian của cả hiệu quả sử dụng nước tại chỗ và ngoài địa điểm (WUE)—WUE tại chỗ do sự thay đổi của điều kiện thời tiết bên ngoài và thay đổi WUE ngoài địa điểm do sự thay đổi của lưới điện. hỗn hợp nhiên liệu năng lượng để đáp ứng nhu cầu thay đổi theo thời gian. Trên thực tế, WUE thay đổi với khoảng thời gian nhanh hơn nhiều so với hàng tháng hoặc theo mùa.


Do đó, bằng cách khai thác tính đa dạng về không gian-thời gian của WUE, chúng ta có thể lên lịch linh hoạt cho việc đào tạo và suy luận mô hình AI để cắt giảm dấu chân nước.


Ví dụ: nếu đào tạo một mô hình AI nhỏ, chúng tôi có thể lên lịch nhiệm vụ đào tạo vào lúc nửa đêm và/hoặc ở vị trí trung tâm dữ liệu với hiệu quả sử dụng nước tốt hơn. Tương tự như vậy, một số người dùng quan tâm đến nước có thể thích sử dụng dịch vụ suy luận của mô hình AI trong những giờ tiết kiệm nước và/hoặc trong các trung tâm dữ liệu tiết kiệm nước, điều này có thể góp phần giảm lượng nước sử dụng cho suy luận của mô hình AI.


Việc quản lý nước theo nhu cầu như vậy bổ sung cho các phương pháp tiết kiệm nước tại chỗ dựa trên kỹ thuật hiện có, tập trung vào phía cung cấp. Ngoài ra, cách tiếp cận của chúng tôi dựa trên phần mềm và do đó có thể được sử dụng miễn phí cùng với bất kỳ hệ thống làm mát nào mà không có yêu cầu cụ thể về điều kiện khí hậu hoặc lắp đặt hệ thống làm mát mới.


Bằng cách minh bạch hơn, chúng tôi có thể biết chính xác thời điểm và địa điểm chúng tôi có các mô hình AI tiết kiệm nước nhất.


Syed: Bạn đề xuất tính minh bạch như một bước hữu ích tiếp theo. Tính minh bạch cao hơn có thể giúp chúng ta trả lời những câu hỏi nào?


Ren: Bằng cách minh bạch hơn, chúng tôi có thể biết chính xác thời điểm và địa điểm chúng tôi có các mô hình AI tiết kiệm nước nhất.


Tính minh bạch cũng giúp đo lường, đánh giá và cải thiện dấu chân nước của mô hình AI, điều này có thể mang lại giá trị lớn cho cộng đồng nghiên cứu. Hiện tại, một số hội nghị về AI đã yêu cầu các tác giả công bố lượng khí thải carbon của các mô hình AI trong bài báo của họ; chúng tôi tin rằng với sự minh bạch và nhận thức, các tác giả cũng có thể tuyên bố dấu chân nước của mô hình AI của họ là một phần tác động đến môi trường.


Với thông tin như vậy, các nhà phát triển mô hình AI có thể lên kế hoạch đào tạo mô hình AI tốt hơn và cũng có thể khai thác tính đa dạng về không gian-thời gian để định tuyến tốt hơn các yêu cầu suy luận của người dùng nhằm tiết kiệm nước mà không làm suy giảm các chỉ số hiệu suất khác.


Ngoài ra, tính minh bạch cũng có thể cho phép người dùng biết lượng nước tiêu thụ của họ trong thời gian chạy và cải thiện lượng nước tiêu thụ của họ (giả sử, họ có thể muốn trì hoãn một số yêu cầu suy luận không khẩn cấp sang những giờ tiết kiệm nước nếu có thể).


Apple đã tích hợp lịch trình năng lượng sạch vào các sản phẩm iPhone của mình bằng cách chọn những giờ sạc có lượng carbon thấp và chúng tôi hy vọng rằng việc đào tạo và suy luận về AI nhận biết nước cũng có thể trở thành hiện thực trong tương lai.


Tôi hy vọng bạn thấy điều này kích thích tư duy như tôi! Điều này đặc biệt xảy ra gần nhà: Bố và chị gái tôi đều là kỹ sư tài nguyên nước và tôi lớn lên ở miền Nam California bị hạn hán. Chắc chắn là chúng ta đang trong thời kỳ bùng nổ công nghệ—nhưng sự đổi mới sẽ phục vụ lợi ích chung của chúng ta chứ không phải xóa bỏ nó.


Cảm ơn vì đã đọc!


Luôn luôn,


Nabiha Syed


Giám đốc điều hành


Đánh dấu


của Nabiha Syed


Cũng được xuất bản ở đây


Ảnh của David Becker trên Bapt