কৃত্রিম বুদ্ধিমত্তা উত্তেজনাপূর্ণ; নতুন প্রযুক্তিগত অগ্রগতি যা আমাদের জীবনকে এক বছরেরও কম সময়ের মধ্যে নিয়েছিল তারপর থেকে থামেনি।
ব্যক্তিগতভাবে, এআই সরঞ্জামগুলির সাথে আমার কিছু সমস্যা রয়েছে এবং এই মুহূর্তে সেগুলি কীভাবে ব্যবহার করা হচ্ছে। এর সাথে, আমি অস্বীকার করতে পারি না যে সঠিক কাজ করার জন্য সঠিক ব্যক্তিকে দেওয়া হলে তারা একটি শক্তিশালী যন্ত্র - কিন্তু আমরা সবাই জানি, মহান ক্ষমতার সাথে মহান দায়িত্ব আসে।
উত্তেজনা এবং অর্ধ-পূর্ণ প্রতিশ্রুতির মধ্যে - আমরা কি কখনো 1,2,3 বিলিয়ন প্যারামিটার মডেলগুলিকে ঘন্টার পর ঘন্টা চালানোর খরচ সম্পর্কে চিন্তা করা বন্ধ করে দিয়েছি, লক্ষ লক্ষ ব্যবহারকারীর জন্য, একযোগে একাধিক উদাহরণ জুড়ে?
আমি সবসময় "ন্যূনতম ওয়েব" ধারণার একজন উকিল ছিলাম (আমি ভবিষ্যতে ধারণাটি সম্পর্কে একটি নিবন্ধ লিখব; বলার অনেক কিছু আছে)। আমরা এমন এক যুগে বাস করি যেখানে একদিকে, প্রত্যেকেই গ্রহের স্বাস্থ্য (এবং সঙ্গত কারণে) সম্পর্কে অত্যন্ত উদ্বিগ্ন বলে মনে হয়। তবুও অন্যদিকে, কেউ ভাবতে থামছে না যে ইন্টারনেট তার বর্তমান অবস্থায় কাঁচা শক্তির ক্ষেত্রে আমাদের কতটা ব্যয় করছে। এটা কি দক্ষ? এটা কি সবুজ? এটা থেকে দূরে.
কিছুক্ষণ আগে, আমি পার্ল ( ওয়েবমিটার ) ব্যবহার করে একটি ছোট টিইউআই টুল লিখেছিলাম, যা আমার ইন্টারনেট ট্র্যাফিক নিরীক্ষণ করে এবং টুলটি চলাকালীন পাঠানো এবং প্রাপ্ত প্যাকেটগুলির বাইট-দৈর্ঘ্য একত্রিত করে।
রেডডিটের প্রথম পৃষ্ঠাটি খোলার মাধ্যমে, আমার টুলটি আমার ইন্টারফেস এবং রেডডিটের সার্ভারের মধ্যে স্থানান্তরিত 5.85 মেগাবাইট ডেটা লগ করেছে।
একটি ওয়েবসাইট হিসাবে Reddit হল পাঠ্য, নিম্ন-থেকে-মধ্য-মানের চিত্র এবং মাঝে মাঝে ভিডিওর সংমিশ্রণ। এটি অত্যন্ত অযৌক্তিক বলে মনে হচ্ছে যে শুধুমাত্র Reddit এর প্রথম পৃষ্ঠাটি খোলার মাধ্যমে আমি গ্রহ জুড়ে এত বেশি ডেটা স্থানান্তর করেছি (পরীক্ষার সময় স্বয়ংক্রিয়-প্লে ভিডিওগুলি বন্ধ ছিল, এই ফলাফলটি ভিডিও সামগ্রী বাদ দেয়)।
Reddit এর প্রথম পৃষ্ঠা, একটি পৃষ্ঠা যা 10 কিলোবাইট সামগ্রী, জাভাস্ক্রিপ্ট এবং CSS (অতিরিক্ত ছবির জন্য সম্ভবত আরও কয়েক কিলোবাইট) দিয়ে শেষ হতে পারে, শুধুমাত্র লোড করার জন্য 300 গুণ ব্যান্ডউইথের প্রয়োজন।
তুলনায় (চাঁদের অবতরণ হলিউডের বেসমেন্টে ঘটেনি বিবেচনা করে), অ্যাপোলো 11 মিশনের জন্য লেখা সফ্টওয়্যারটির আকার ছিল মাত্র 72 কিলোবাইট।
শুধু এটার জন্য, কোটি কোটি মানুষের কল্পনা করুন, Reddit এর প্রথম পাতা খুলছেন, সব একসাথে, প্রতি মুহূর্তে, সব সময়। চেষ্টা করুন এবং চিন্তা করুন: ডেটা স্থানান্তর করার সরাসরি খরচ কি? সেকেন্ডারি খরচ কি? ইন্টারনেট গ্রাসকারী মানুষ হিসেবে আমরা কত শক্তি নষ্ট করছি?
এই ধারণাটি গত বছর বা তার বেশি সময় ধরে আমার মনে বাস করছে যা আমি প্রথম স্থানে আমার পার্ল টুলটি একসাথে হ্যাক করার প্রধান কারণ ছিল। একটি "ন্যূনতম ওয়েব" চিন্তা আরেকটির দিকে নিয়ে যায়, এবং আমি বুঝতে পেরেছিলাম যে আমরা হাইপ (বা ঘৃণা) দ্বারা এতটাই গ্রাস করছি যে আমরা আমাদের কৃত্রিম বুদ্ধিমত্তার প্রচেষ্টার খরচ উপেক্ষা করছি।
সঠিকভাবে? আমরা পারি না। এই পরিষেবাগুলি কীভাবে কাজ করে তা না জেনেই নয়: তারা কোন সিপিইউ বা জিপিইউ (বা ডেডিকেটেড চিপ) ব্যবহার করছে। কতগুলি দৃষ্টান্ত তারা চলছে, তাদের লোড কত, সমালোচনামূলক হার্ডওয়্যারের সঠিক শক্তি খরচ কত ইত্যাদি?
কিন্তু আমরা একটি সুন্দর বাস্তবসম্মত (যদিও ততটা সঠিক নয়) উপসংহারে আসতে পারি যদি আমরা এটিতে আমাদের মন রাখি। আমি এই উদাহরণের জন্য Fooocus বেছে নিয়েছি যা সেখানে সবচেয়ে সোজা (এবং আমি জনপ্রিয় বিশ্বাস করি) স্থিতিশীল বিস্তার GUI। চলুন সহজ শুরু করা যাক:
Fooocus ব্যবহার করে, একটি ইমেজ তৈরি করতে আমার পুরানো-টাইমার GPU (একটি Quadro P2000) প্রায় 10 মিনিট সময় নিয়েছে। Fooocus এর সংগ্রহস্থলে কর্মক্ষমতা সারণী অনুসারে, আমরা জানি যে একটি Nvidia RTX 4XXX GPU ব্যবহার করলে আমাদের দ্রুততম ফলাফল পাওয়া যাবে। আমার কোয়াড্রো একটি এনভিডিয়া জিটিএক্স 1060 এর সাথে কিছুটা তুলনীয়, তাই, আমরা জানি যে একটি এনভিডিয়া জিটিএক্স 1060 জিপিইউ ব্যবহার করে, আমরা প্রায় 10 মিনিটের মধ্যে একটি চিত্র তৈরি করতে পারি।
অনলাইনে কিছু অনুসন্ধান করার পর, আমি উপসংহারে পৌঁছেছি যে AI/ML-এর জন্য সবচেয়ে বেশি ব্যবহৃত (এন্টারপ্রাইজ) GPU হল Nvidia A100 (লোডের অধীনে 400W পর্যন্ত)।
এনভিডিয়া এ100 হল এনভিডিয়া জিটিএক্স 1060 এর চেয়ে ব্যাপকভাবে শক্তিশালী জিপিইউ; এটি AI এবং ML-এর জন্য বিশেষভাবে নির্মিত। অতএব, ধরা যাক যে একটি Nvidia A100 ব্যবহার করে একটি চিত্র তৈরি করতে 5 সেকেন্ড সময় লাগবে (যদি কেউ এটি পড়েন তাদের A100 এবং এর কার্যকারিতা সম্পর্কে সঠিক তথ্য থাকে তবে দয়া করে শেয়ার করুন)।
সূত্র E = P * T ব্যবহার করে, 5 সেকেন্ডের জন্য লোডের অধীনে একটি Nvidia A100 GPU পাওয়ার খরচ প্রায় 0.5 ওয়াট-ঘন্টা।
এই উদাহরণে যোগ করা: মিডজার্নি (বা অন্যান্য এআই ইমেজ জেনারেশন সার্ভিস) প্রতি প্রম্পটে 4টি ছবি তৈরি করে। ধরা যাক, পরিষেবাটি ছবিগুলি তৈরি করতে Nvidia A100s-এর একটি অ্যারে ব্যবহার করছে যার অর্থ হল পরিষেবাটি সম্ভবত প্রতিটি ব্যবহারকারীর জন্য প্রতিটি প্রম্পটের জন্য প্রায় 2 ওয়াট-ঘন্টা শক্তি নষ্ট করছে।
নভেম্বর 2023 পর্যন্ত, মিডজার্নিতে 2.5 মিলিয়ন DAU আছে।
2Wh x 2,500,000 Users x 24 Hours = 120,000,000Wh (per day, considering every DAU is executing a prompt per hour, in reality, it is much more than that). 120,000,000Wh = 120,000MWh
120,000 মেগা ওয়াট ঘন্টা সম্ভাব্যভাবে 100,000 পরিবারকে পুরো এক মাসের জন্য বিদ্যুৎ সরবরাহ করতে পারে।
পরিমিতভাবে, মিডজার্নি, ডাল-ই বা এমনকি স্ব-হোস্টেড সলিউশন যেমন ফুকস, প্রতিদিন কমপক্ষে 50 মিলিয়ন ওয়াট-ঘন্টা নষ্ট করে, প্রতিটি (তাদের জিপিইউগুলি অত্যাধুনিক এবং প্রতিটি DAU বিবেচনা করে প্রতিদিন কয়েক ঘন্টার জন্য পরিষেবা ব্যবহার করে)।
এই পরিমাণ শক্তি সম্ভাব্যভাবে প্রতিদিন 100,000 গড় আকারের পরিবারকে এক মাসের জন্য শক্তি দিতে পারে।
মনে রাখবেন যে আমরা শুধুমাত্র ইমেজ জেনারেশন সার্ভিসের কথা বলেছি; আসুন অন্য সমস্ত পরিষেবাগুলি, যেমন চ্যাটজিপিটি, জেমিনি, বার্ড এবং তাদের সমস্ত সংস্করণ এবং স্বাদ সম্পর্কে ভুলবেন না। তালিকা, এবং বর্জ্য, যায়.
এই উদীয়মান সমস্যাটি মোকাবেলা করার জন্য বিকাশকারী হিসাবে আমাদের কীভাবে একত্রিত হওয়া উচিত? কীভাবে আমরা অন্যদেরকে দায়িত্বশীলভাবে শক্তি ব্যবহার করতে শিক্ষিত করার ব্যবস্থা নিতে পারি? আমি এই বিষয় এবং তার সম্ভাব্য সমাধান সম্পর্কে আপনার চিন্তা শুনতে চাই.
এছাড়াও এখানে প্রকাশিত