paint-brush
بهینه سازی کارایی مرکز داده: شیرجه عمیق در تکنیک های خنک کننده آزادتوسط@egorkaritskii
100,098 قرائت
100,098 قرائت

بهینه سازی کارایی مرکز داده: شیرجه عمیق در تکنیک های خنک کننده آزاد

توسط Egor Karitskii10m2024/05/14
Read on Terminal Reader
Read this story w/o Javascript

خیلی طولانی؛ خواندن

با بررسی مزایا، چالش ها و تاثیر آن بر کارایی و قابلیت اطمینان، پتانسیل تحول آفرین فناوری خنک کننده رایگان را در مراکز داده کشف کنید. کاوش کنید که چگونه این راه حل سبز استراتژی های خنک کننده را متحول کرده و آینده عملیات مرکز داده را شکل می دهد.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail

Coin Mentioned

Mention Thumbnail
featured image - بهینه سازی کارایی مرکز داده: شیرجه عمیق در تکنیک های خنک کننده آزاد
Egor Karitskii HackerNoon profile picture
0-item
1-item


در مقاله قبلی ، گسترش سریع زیرساخت مرکز داده و افزایش مصرف برق ناشی از آن را مورد بحث قرار دادیم. از آنجایی که سرورها برق را در حین کار به گرما تبدیل می‌کنند، مدیریت دمای بالا و خنک‌کردن امکانات و تجهیزات مرکز داده به مشکل شماره یک تبدیل می‌شود. برای تیم های دی سی


در حالی که روش‌های خنک‌کننده سنتی، از جمله دستگاه‌های تهویه مطبوع و چیلرها به‌طور مؤثری محل‌های مرکز داده و سرورها را خنک می‌کنند، اما گرانی آن‌ها همچنان یک اشکال مهم است. خنک کننده رایگان برخلاف روش های سنتی نیاز به سرمایه گذاری قابل توجهی ندارد، اما همان سطح کارایی و قابلیت اطمینان را ارائه می دهد. در این مقاله، مروری دقیق بر فناوری خنک‌کننده رایگان ارائه می‌کنم و مزایا، محدودیت‌ها و الزامات اجرای موفقیت‌آمیز آن را برجسته می‌کنم.


فیزیک خنک کننده آزاد

برای درک فیزیک پشت خنک کننده آزاد، باید فرمول انرژی گرمایی را دوباره بررسی کنیم:


Q = mcΔT


در اینجا، 'Q' مقدار گرمای بدست آمده یا از دست رفته را نشان می دهد، 'm' نشان دهنده جرم نمونه است (در مورد ما، جرم هوا در مرکز داده)، 'c' نشان دهنده ظرفیت گرمایی ویژه هوا است. و ΔT نشان دهنده اختلاف دما است.


در یک مرکز داده، منبع حرارت اولیه CPU است. به طور معمول، 2 تا 4 CPU وجود دارد که هر کدام تقریباً 200 وات کار می کنند. همانطور که قبلاً گفته شد، تمام انرژی الکتریکی مصرف شده توسط CPU ها به گرما تبدیل می شود. بنابراین، به عنوان مثال، با 2 CPU، ما 400 وات گرما تولید می کنیم که باید دفع شود. اکنون هدف ما تعیین میزان هوای مورد نیاز برای این منظور است.


پارامتر ΔT یا اختلاف دما نشان می دهد که هرچه دمای هوای بیرون کمتر باشد، جرم هوای کمتری برای خنک کردن CPU ها مورد نیاز است. به عنوان مثال، اگر دمای هوای ورودی 0 درجه سانتیگراد و دمای خروجی 35 درجه سانتیگراد باشد، ΔT تنها 35 خواهد بود، که نشان دهنده نیاز نسبتاً کمتر به جرم هوا است. با این حال، در طول فصل تابستان، به دلیل افزایش دمای محیط، سرمایش چالش برانگیزتر می شود. هر چه دمای بیرون بالاتر باشد، مقدار هوای بیشتری برای خنک کردن سرورها مورد نیاز خواهد بود.



محدودیت‌های دمایی اجزای شبکه و سرور

اگرچه خنک کننده رایگان ممکن است برای آب و هوای معتدل و سرد کارآمد باشد، اما به دلیل محدودیت های دما در اجزای سرور، همچنان محدودیت هایی دارد. اجزای حیاتی در تجهیزات IT و شبکه، مانند پردازنده ها، رم، هارد دیسک ها، SSD ها و درایوهای NVMe، دارای شرایط دمایی عملیاتی هستند:


  • پردازنده: حداکثر 89 درجه سانتیگراد
  • رم: حداکثر 75 درجه سانتیگراد
  • هارد دیسک: حداکثر 50 درجه سانتی گراد
  • SSD و درایوهای NVMe: حداکثر 47-48 درجه سانتیگراد


این محدودیت ها به طور مستقیم بر مناسب بودن دمای هوای بیرون برای خنک کردن تأثیر می گذارد. خنک‌سازی رایگان در مناطقی که دمای بیرون از این آستانه‌ها فراتر می‌رود یا حتی به آن‌ها نزدیک می‌شود قابل اجرا نیست، زیرا می‌تواند به دلیل گرمای بیش از حد به سیستم آسیب برساند. محدودیت های منطقه ای

همانطور که قبلاً توضیح دادیم، دمای بیرون باید به طور مداوم کمتر از حداکثر دمای عملیاتی تجهیزات فناوری اطلاعات باشد تا خنک‌سازی آزاد مؤثر باشد. این امر مستلزم بررسی دقیق شرایط آب و هوایی محل DC است. سازمان ها باید پیش بینی های بلندمدت آب و هوا را تجزیه و تحلیل کنند تا اطمینان حاصل کنند که دما از آستانه های مورد نیاز تجاوز نمی کند، حتی در روزها یا ساعت های خاص. علاوه بر این، با توجه به طول عمر طولانی مراکز داده (معمولاً 10-15 سال)، تأثیرات گرمایش جهانی نیز باید در تصمیم گیری های مکان یابی شود.



الزامات معماری گره سرور

در زمینه فیزیک، دستیابی به خنک کننده کارآمد در سرورها به اطمینان از جریان هوای کافی از طریق سیستم متکی است. معماری سرور نقش مهمی در این فرآیند ایفا می کند.


نمونه‌ای از معماری سرور با حفره‌های تهویه که جریان هوای لازم را تسهیل می‌کند و اجازه خنک‌سازی رایگان موثر را می‌دهد


برعکس، سرورهایی که فاقد ویژگی‌های طراحی مناسب هستند، مانند سوراخ‌ها یا دهانه‌ها، می‌توانند جریان هوا را مختل کنند و به طور بالقوه کارایی کلی مکانیزم خنک‌کننده آزاد را به خطر بیندازند.


کنترل رطوبت

سطح رطوبت یکی دیگر از ملاحظات مهم در هنگام خنک کردن رایگان است. از آنجایی که کنترلی بر شرایط رطوبت خارجی نداریم، دو پرسش مرتبط مطرح می شود: اول، رسیدگی به سطوح رطوبت نزدیک یا بیش از 100٪ در مرکز داده (DC). ثانیا، پرداختن به سناریوهای رطوبت بسیار کم هوا، مانند یک روز یخبندان فوریه با دمای بیرون از -30 درجه سانتیگراد و رطوبت نسبی از 2٪ تا 5٪. بیایید به طور سیستماتیک این موقعیت ها را بررسی کنیم.


در شرایط رطوبت بالا، نگرانی مشترک در مورد وقوع احتمالی تراکم و اثرات نامطلوب آن بر عملکرد تجهیزات وجود دارد. برخلاف این نگرانی، در مناطق خنک‌کننده DC، جایی که فرآیند خنک‌سازی اتفاق می‌افتد، تراکم جلوگیری می‌شود. این به دلیل این اصل است که وقتی هوای گرم و مرطوب با سطوح سردتر تماس پیدا می کند، تراکم ایجاد می شود. با این حال، در سیستم خنک کننده آزاد DC، هیچ عنصری سردتر از هوای اطراف نیست. در نتیجه، تراکم ذاتاً مانع می شود و نیاز به اقدامات پیشگیرانه را از بین می برد.


در مقابل، هنگام مواجهه با رطوبت کم، نگرانی به سمت تولید الکتریسیته ساکن تغییر می‌کند که تهدیدی برای پایداری تجهیزات است. این موضوع با تراکم همراه نیست، اما نیاز به یک راه حل متمایز دارد. کاهش شامل روش های زمین و استفاده از یک پوشش تخصصی کف است. این اقدامات با روش های تعیین شده برای محافظت از تجهیزات داخلی در برابر الکتریسیته ساکن مطابقت دارد. با اتصال به زمین عناصر ساختمانی، قفسه ها و تجهیزات فناوری اطلاعات، بار استاتیکی به طور بی ضرر به زمین پراکنده می شود و یکپارچگی تجهیزات حفظ می شود.


در آب و هوای طبیعی، مواردی با رطوبت بسیار زیاد یا کم به ندرت دیده می شود. استثناهای قابل توجه عبارتند از رویدادهای نادر مانند رعد و برق که رطوبت 100٪ در ژوئیه به دست می آید یا یخبندان شدید که باعث رطوبت بسیار کم می شود. با این حال، در اکثر مواقع، سطوح رطوبت به خوبی در محدوده قابل قبولی باقی می‌ماند که حتی در صورت عدم وجود مداخلات فعال، هیچ آسیبی به تجهیزات وارد نمی‌کند.


کمیت و سرعت هوا

همانطور که قبلاً بحث کردیم، برای تسهیل خنک سازی موثر به حجم قابل توجهی از هوای خارجی نیاز داریم. به طور همزمان، یک نیاز ظاهراً غیر شهودی ظاهر می شود - حفظ جریان هوای کم در داخل ساختمان. این پارادوکس ظاهری ریشه در چالش‌های ناشی از جریان‌های هوای پرسرعت در گردش دارد.


برای ساده تر، سرعت بالای هوا را به عنوان جریانی قوی از یک لوله تصور کنید که چرخش و آشفتگی را در اطراف تجهیزات فناوری اطلاعات ایجاد می کند. این تلاطم به طور بالقوه منجر به حرکات نامنظم هوا و گرمای بیش از حد موضعی می شود. برای پرداختن به این موضوع، ما از نظر استراتژیک سرعت هوایی کم 1-2 متر در ثانیه را در سراسر فضا هدف گذاری کرده ایم.


حفظ این سرعت هوای کنترل شده به ما امکان می دهد تا تلاطم را از بین ببریم. سرعت بالاتر باعث بی نظمی در حرکت هوا می شود. با رعایت محدوده 1-2 متر در ثانیه، جریان هوای صاف و یکنواخت را تقویت می کنیم و از گرمای بیش از حد موضعی جلوگیری می کنیم. این تعادل ظریف خنک‌سازی بهینه تجهیزات فناوری اطلاعات را با کنار زدن مشکلات مرتبط با جریان‌های هوای پرسرعت تضمین می‌کند.


همانطور که مشاهده می شود، رویکرد خنک کننده آزاد حول استفاده کارآمد از هوای خارجی و در عین حال اولویت دادن به سرعت هوای داخلی پایین کنترل شده می چرخد. این استراتژی عمدی به حفظ جریان هوای آرام و یکنواخت کمک می کند و از کارایی خنک کننده تجهیزات فناوری اطلاعات اطمینان می دهد.


مفهوم ساختمان

در پارادایم خنک کننده آزاد، کانال های هوای سنتی در ساختار ساختمان به کار نمی روند. بر خلاف راه‌اندازی‌های معمولی با کانال‌های هوای معین در دیوارها، سقف‌ها یا مناطق خاص، مراکز پردازش داده یک رویکرد غیرمتعارف را اتخاذ می‌کنند. خود ساختمان به عنوان یک مجرای هوا در نظر گرفته شده است که واحدهای تهویه مطبوع سنتی را منسوخ می کند. مقیاس بسیار زیاد این کانال های هوا آنها را به اجزای جدایی ناپذیر اتاق ها و طبقات تبدیل می کند.


یک تصویر شماتیک از طراحی ساختمان خنک کننده آزاد


فرآیند جریان هوا زمانی شروع می شود که هوای خارجی وارد ساختمان می شود و از دو نوع فیلتر عبور می کند - فیلترهای درشت و فیلترهای ریز. هنگامی که هوا تحت فرآیند تمیز کردن قرار می گیرد، توسط فن ها به سمت حجم های وسیع ساختمان، تقریبا معادل ارتفاع چهار طبقه، رانده می شود. این حجم قابل توجه هدف خود را دارد: کاهش سرعت جریان هوا، کاهش سرعت آن به محدوده مورد نیاز 1-2 متر در ثانیه. پس از آن، هوا به اتاق ماشین آلات فرود می آید.


پس از عبور از اتاق ماشین آلات، هوا از طریق قفسه های IT به سفر خود ادامه می دهد و به سمت راهرو گرم پیش می رود. از آنجا، قبل از بیرون راندن از طریق فن های اگزوز، وارد جمع کننده هوای گرم می شود. این مسیر جریان هوا ساختار یافته، فرآیند خنک‌سازی کارآمد را در عین حفظ سرعت هوای کنترل‌شده تضمین می‌کند.


سرعت و حجم هوا

انتخاب عمدی طراحی برای استفاده از حجم های وسیع ساختمانی یک هدف دوگانه را دنبال می کند. اول از همه، امکان کاهش تدریجی سرعت هوا را فراهم می کند و اطمینان حاصل می کند که جریان هوا به سرعت مطلوب 1-2 متر در ثانیه می رسد. این سرعت هوای کنترل شده برای جلوگیری از تلاطم و حفظ جریان آرام ضروری است، به ویژه هنگامی که هوا از طریق تجهیزات حساس IT پیشرفت می کند. ثانیاً، حجم قابل توجه حجم هوای لازم را برای دفع موثر گرمای تولید شده در خود جای می دهد. تعامل همزمان سرعت و حجم هوا به موفقیت کلی سیستم کمک می کند.


فشار دیفرانسیل به عنوان تنها محرک مدیریت

در یک راه‌اندازی خنک‌کننده رایگان، کنترلی بر دمای هوای خارجی نداریم، که منجر به تغییرات در دمای هوای ورودی به مرکز داده (DC) می‌شود. با وجود این، برآورد جریان هوای مورد نیاز برای خنک سازی تجهیزات ضروری است. برای پرداختن به این موضوع، بر روش فشار دیفرانسیل تکیه می کنیم.


در داخل هر رک فناوری اطلاعات، سرورهایی با فن‌های داخلی با سرعت‌های متفاوتی کار می‌کنند و مجموعاً فشار دیفرانسیل بین جلو و پشت رک ایجاد می‌کنند. با وجود سرورهای متعدد که هر کدام به جریان کلی هوا کمک می کنند، این اختلاف فشار به تدریج بین راهروهای سرد و گرم ایجاد می شود. با استفاده از سنسورهای فشار در هر دو راهرو و خارج از ساختمان DC می توانیم این فشار تفاضلی را اندازه گیری کنیم.


این محاسبه شامل کم کردن داده‌های سنسور فشار در راهروی گرم از فشار اتمسفر و کم کردن داده‌های سنسور فشار در راهروی سرد از فشار اتمسفر است. بنابراین مانند مثال زیر:


مثال دنیای واقعی


سپس مقادیر به دست آمده ما را در تعیین هوای لازم برای DC و اگزوز مورد نیاز برای جبران عملکرد فن های سرور راهنمایی می کند. به عبارت ساده‌تر، ما نیازهای جریان هوای خود را بر اساس اختلاف فشار اندازه‌گیری می‌کنیم و به ما امکان می‌دهد فرآیند خنک‌سازی را در DC به طور موثر مدیریت کنیم.


اتاق گرمایش و اختلاط

سیستم های گرمایش سنتی معمولاً در مراکز داده با سرمایش رایگان اجرا نمی شوند. استفاده از آب به دلیل هزینه و خطرات احتمالی برای تجهیزات غیر منطقی تلقی می شود. این یک چالش در هنگام سرماخوردگی شدید به وجود می‌آورد که به -20 تا 30 درجه در بیرون می‌رسد. در حالی که تجهیزات به خوبی از عهده آن بر می آیند، مهندسان به دنبال رویکرد ملایم تری هستند. ظریف ترین و منطقی ترین راه حل در اینجا استفاده مجدد از هوای گرم تولید شده توسط تجهیزات فناوری اطلاعات است. هدایت هوای گرم از سرورها به داخل یک محفظه اختلاط و بازگرداندن بخشی از آن به جریان اصلی هوا، این سیستم محل را در زمستان گرم نگه می دارد و امکان صرفه جویی در هزینه های گرمایش را فراهم می کند.


سادگی و قابلیت اطمینان

یک تز کلیدی در تئوری قابلیت اطمینان بیان می کند که سادگی باعث ایجاد قابلیت اطمینان می شود. این برای سیستم خنک کننده رایگان که به عنوان یک مفهوم بسیار ساده است، صدق می کند. این سیستم به عنوان یک مانع عمل می کند، هوا را از بیرون از طریق فیلترها عبور می دهد، آن را از تجهیزات فناوری اطلاعات عبور می دهد و سپس آن را بیرون می زند.


فقدان سیستم های پیچیده قابلیت اطمینان را افزایش می دهد و تنها فن ها در هوای گرم آسیب پذیر هستند. روش خنک‌سازی آزاد نمونه‌ای از ساده‌سازی رادیکال سیستم است که به طور قابل‌توجهی قابلیت اطمینان را با کاهش تعداد عناصر بهبود می‌بخشد.


طرفداران دی سی در مقابل طرفداران سرور

اقتدار سلسله مراتبی فن ها یکی دیگر از سوالات اساسی در دینامیک جریان هوا در DCها است. همانطور که گفتیم، فن های بزرگ در سطح DC و در سطح سرور وجود دارند. سوال این است: آیا فن های مرکز داده صرفاً هوا را تأمین می کنند و فن های سرور را به میزان مورد نیاز مصرف می کنند؟ یا اینکه این تقاضا از طرفداران سرور سرچشمه می گیرد و طرفداران DC را وادار می کند تا نیازهای خود را برآورده کنند؟


مکانیسم به شرح زیر است: فن های سرور در این فرآیند نقش غالب دارند و جریان هوای لازم را تعیین می کنند. متعاقباً فن های DC با ارائه حجم مورد نیاز هوا پاسخ می دهند. واضح است که اگر تقاضای تجمعی از همه سرورها از ظرفیت عرضه فن DC فراتر رود، می تواند منجر به گرمای بیش از حد بالقوه شود.

بنابراین پاسخ این است که طرفداران سرور در این پویایی اولویت دارند. آنها جریان هوا را تنظیم می کنند و مقدار هوای مورد نیاز را مشخص می کنند.


راندمان و محاسبه PUE

برای ارزیابی کارایی یک پروژه DC، به طور سنتی از محاسبه اثربخشی مصرف برق (PUE) استفاده می‌شود. فرمول PUE نسبت توان کل تسهیلات به توان تجهیزات فناوری اطلاعات است:


PUE = توان کل امکانات / توان تجهیزات فناوری اطلاعات


در حالت ایده آل، برابر با 1 است، به این معنی که تمام انرژی بدون هیچ هدر رفتنی به تجهیزات فناوری اطلاعات هدایت می شود. با این حال، دستیابی به این سناریوی عالی در پروژه های دنیای واقعی نادر است.


مسئله دیگری زمانی مطرح می شود که ما سعی می کنیم یک روش روشن برای محاسبه اثربخشی مصرف انرژی (PUE) ایجاد کنیم. بنابراین، برای مثال، در سیستم ما، ما دارای یک متریک هستیم که مصرف برق آنی را بر حسب وات نشان می‌دهد، که محاسبه PUE را در زمان واقعی ممکن می‌سازد.


علاوه بر این، ما می‌توانیم میانگین PUE را در یک دوره سالانه استخراج کنیم، که ارزیابی جامع‌تری را با توجه به نوسانات فصلی ارائه می‌دهد. این امر به ویژه با توجه به تفاوت در مصرف انرژی بین فصول مرتبط است. به عنوان مثال، نابرابری در نیازهای خنک کننده بین ماه های تابستان و زمستان. این بدان معناست که اگر می‌خواهیم ارزیابی قابل اعتمادتری داشته باشیم، باید میانگین سالانه را اولویت بندی کنیم که ارزیابی متعادل‌تر و جامع‌تری ارائه می‌کند.


همچنین مهم است که PUE را نه تنها از نظر انرژی، بلکه از نظر واحدهای پولی نیز بررسی کنیم، در نتیجه نوسانات فصلی قیمت برق را نیز در بر می گیرد. ارزیابی PUE در شرایط پولی، دیدگاه جامع تری در مورد کارایی عملیاتی ارائه می دهد.


علاوه بر این، این رویکرد امکان‌هایی را برای دستیابی به مقدار PUE کمتر از 1 در صورت اندازه‌گیری در دلار نشان می‌دهد. به عنوان مثال، زمانی که ما از گرمای اتلاف برای گرم کردن آب استفاده می کنیم و آن را بیشتر به شهرهای مجاور می فروشیم، ممکن می شود. نمونه های قابل توجه، مانند مرکز داده گوگل در ایالات متحده آمریکا و تاسیسات Yandex در فنلاند، عملی بودن چنین شیوه هایی را به ویژه در مناطقی که با هزینه های انرژی بالا مشخص می شود، نشان می دهد.


کارایی در مقابل قابلیت اطمینان

نگرانی در مورد کاهش هزینه ها و افزایش کارایی اغلب سوالاتی را در مورد اثرات منفی بالقوه بر قابلیت اطمینان ایجاد می کند. با این حال، من می خواهم تأکید کنم که در خنک سازی رایگان، پیگیری کارایی قابلیت اطمینان را به خطر نمی اندازد. در عوض، عوارض جانبی تکنولوژیکی آن حتی می تواند کارایی را افزایش دهد. به عنوان مثال، همانطور که قبلاً بحث کردیم، هدایت گرمای اضافی به پمپ های حرارتی برای مزایای اضافی، مانند تولید آب گرم برای شهرهای مجاور، بدون از بین بردن قابلیت اطمینان، به یک عمل سودمند مالی تبدیل می شود.



آینده خنک کننده رایگان

علیرغم تمام مزایایی که خنک کننده رایگان ارائه می دهد، صنعت مرکز داده همچنان با رویکردی محافظه کارانه هدایت می شود و نیاز به قابلیت اطمینان اثبات شده دارد، با تمایل به مقاومت در برابر راه حل های نوآورانه. اتکا به گواهینامه های ارگان هایی مانند موسسه Uptime برای بازاریابی مانع دیگری برای راه حل های خنک کننده رایگان ایجاد می کند که فاقد گواهینامه معتبر هستند و باعث می شود ارائه دهندگان تجاری به آنها با شک و تردید نگاه کنند.


با این حال، گرایشی در میان مقیاس‌کننده‌های شرکت‌های بزرگ وجود دارد که خنک‌کننده رایگان را به عنوان راه‌حل اصلی برای DC‌های خود اتخاذ می‌کنند. با توجه به تعداد فزاینده ای از شرکت ها که مقرون به صرفه بودن و مزایای عملیاتی این فناوری را تصدیق می کنند، انتظار داریم که در 10 تا 20 سال آینده مراکز داده خنک کننده بدون نیاز به شرکت های بزرگ بیشتری ظاهر شوند.