paint-brush
Оптимизиране на ефективността на центъра за данни: Задълбочено потапяне в техниките за свободно охлажданеот@egorkaritskii
100,098 показания
100,098 показания

Оптимизиране на ефективността на центъра за данни: Задълбочено потапяне в техниките за свободно охлаждане

от Egor Karitskii10m2024/05/14
Read on Terminal Reader
Read this story w/o Javascript

Твърде дълго; Чета

Открийте преобразуващия потенциал на технологията за свободно охлаждане в центровете за данни, като изследвате нейните предимства, предизвикателства и въздействие върху ефективността и надеждността. Разгледайте как това зелено решение революционизира стратегиите за охлаждане и оформя бъдещето на операциите на центровете за данни.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail

Coin Mentioned

Mention Thumbnail
featured image - Оптимизиране на ефективността на центъра за данни: Задълбочено потапяне в техниките за свободно охлаждане
Egor Karitskii HackerNoon profile picture
0-item
1-item


В предишната статия обсъдихме бързото разрастване на инфраструктурата на центъра за данни и увеличаването на потреблението на електроенергия, до което доведе. Тъй като сървърите преобразуват електричеството в топлина по време на работа, управлението на високите температури и охлаждането на съоръженията и оборудването на центъра за данни се превръща в проблем номер 1 за отборите на DC.


Докато традиционните методи за охлаждане, включително климатици и чилъри, ефективно охлаждат помещенията и сървърите на центровете за данни, тяхната скъпост остава значителен недостатък. Free cooling за разлика от традиционните методи не изисква значителни инвестиции, но предлага същото ниво на ефективност и надеждност. В тази статия ще направя подробен преглед на технологията за свободно охлаждане, като подчертая предимствата, ограниченията и изискванията за успешно внедряване.


Физика на свободното охлаждане

За да разберем физиката зад свободното охлаждане, ще трябва да преразгледаме формулата за топлинна енергия:


Q = mcΔT


Тук „Q“ представлява количеството получена или загубена топлина, „m“ означава масата на пробата (в нашия случай масата на въздуха в центъра за данни), „c“ означава специфичния топлинен капацитет на въздуха, и ΔT означава температурната разлика.


В центъра за данни основният източник на топлина е процесорът. Обикновено има 2 до 4 процесора, всеки от които работи с приблизително 200 вата. Както беше обсъдено по-рано, цялата електрическа енергия, консумирана от процесорите, се преобразува в топлина. Следователно, с 2 процесора, например, ние генерираме 400 вата топлина, която трябва да бъде разсеяна. Сега нашата цел е да определим количеството въздух, необходимо за тази цел.


Параметърът ΔT или температурната разлика показва, че колкото по-ниска е температурата на външния въздух, толкова по-малко въздушна маса е необходима за охлаждане на процесорите. Например, ако температурата на входящия въздух е 0°C, а изходящата температура е 35°C, ΔT ще бъде само 35, което означава доста по-ниско изискване за въздушна маса. През летния сезон обаче охлаждането става по-трудно поради повишаването на температурата на околната среда. Колкото по-висока е външната температура, толкова по-голямо количество въздух ще е необходимо за охлаждане на сървърите.



Температурни ограничения на сървъра и мрежовите компоненти

Въпреки че свободното охлаждане може да е ефективно за умерен и студен климат, то все още има ограничения поради температурни ограничения на сървърните компоненти. Критичните компоненти в ИТ и мрежовото оборудване, като процесори, RAM, HDD, SSD и NVMe устройства, имат изисквания за работна температура:


  • Процесори: max 89°C
  • RAM: максимум 75°C
  • HDD: максимум 50°C
  • SSD и NVMe дискове: максимум 47-48°C


Тези ограничения пряко влияят върху пригодността на температурите на външния въздух за охлаждане. Безплатното охлаждане не би било жизнеспособно в региони, където външните температури надвишават тези прагове или дори се доближават до тях, тъй като може да повреди системата поради прегряване. Регионални ограничения

Както вече обяснихме, външните температури трябва постоянно да остават по-ниски от максималните работни температури на ИТ оборудването, за да бъде ефективно свободното охлаждане. Това налага внимателно разглеждане на климатичните условия на местоположението на DC. Организациите трябва да анализират дългосрочните метеорологични прогнози, за да гарантират, че температурите не надвишават необходимите прагове, дори в определени дни или часове. Освен това, като се има предвид дългият живот на центровете за данни (обикновено 10-15 години), ефектите от глобалното затопляне също трябва да бъдат взети предвид при решенията за местоположение.



Изисквания за архитектурата на сървърния възел

В контекста на физиката постигането на ефективно охлаждане в сървърите разчита на осигуряването на обилен въздушен поток през системата. Архитектурата на сървъра играе важна роля в този процес.


Пример за сървърна архитектура, включваща вентилационни отвори, които улесняват необходимия въздушен поток и позволяват ефективно свободно охлаждане


Обратно, сървъри без подходящи дизайнерски характеристики, като перфорации или отвори, могат да възпрепятстват въздушния поток, което потенциално компрометира цялостната ефективност на механизма за свободно охлаждане.


Контрол на влажността

Нивото на влажност е друго критично съображение, когато става въпрос за свободно охлаждане. Тъй като ни липсва контрол върху външните условия на влажност, възникват две уместни запитвания: първо, адресиране на нива на влажност, близки или надвишаващи 100% в центъра за данни (DC); второ, адресиране на сценарии с много ниска влажност на въздуха, като например през мразовит февруарски ден с външна температура от -30°C и относителна влажност, варираща от 2% до 5%. Нека систематично да разгледаме тези ситуации.


При условия на повишена влажност има обща загриженост относно потенциалната поява на кондензация и нейните неблагоприятни ефекти върху функционалността на оборудването. Противно на тази загриженост, в рамките на зоните за повторно охлаждане на DC, където протича процесът на охлаждане, кондензацията е изключена. Това се дължи на принципа, че се получава конденз, когато топъл, влажен въздух влезе в контакт с по-студени повърхности. Въпреки това, в рамките на системата за свободно охлаждане на DC, нито един елемент не е по-студен от околния въздух. Следователно, кондензацията е присъщо възпрепятствана, което елиминира необходимостта от проактивни мерки.


Обратно, когато се работи с ниска влажност, опасението се измества към генерирането на статично електричество, което представлява заплаха за стабилността на оборудването. Този проблем не е свързан с кондензация, но изисква специално решение. Смекчаването включва процедури за заземяване и нанасяне на специализирано подово покритие. Тези мерки са в съответствие с установените методи за защита на вътрешното оборудване срещу статично електричество. Чрез заземяване на конструктивни елементи, стелажи и ИТ оборудване статичният заряд се разсейва безвредно за земята, като се запазва целостта на оборудването.


В естествения климат случаите на изключително висока или ниска влажност са редки. Забележителните изключения включват редки събития като гръмотевична буря, достигаща 100% влажност през юли, или силен студ, причиняващ много ниска влажност. Въпреки това през по-голямата част от времето нивата на влажност остават в приемливи граници, които не причиняват никаква вреда на оборудването, дори при липса на активни намеси.


Количество и скорост на въздуха

Както вече обсъдихме, за да улесним ефективното охлаждане, се нуждаем от значителен обем външен въздух. Едновременно с това се появява едно привидно неинтуитивно изискване – поддържане на нисък въздушен поток в сградата. Този очевиден парадокс се корени в предизвикателствата, породени от високоскоростните въздушни течения, циркулиращи вътре.


За да опростите, представете си висока въздушна скорост като силен поток от тръба, създаващ завихряния и турбуленция около ИТ оборудването. Тази турбуленция потенциално води до неправилни въздушни движения и локализирано прегряване. За да се справим с това, ние стратегически се стремим към обща ниска въздушна скорост от 1-2 метра в секунда в цялото пространство.


Поддържането на тази контролирана въздушна скорост ни позволява да елиминираме турбуленцията. По-високата скорост би създала риск от нередности в движението на въздуха. Като се придържаме към диапазона от 1-2 метра в секунда, ние насърчаваме плавен, равномерен въздушен поток, като избягваме локално прегряване. Този деликатен баланс осигурява оптимално охлаждане на ИТ оборудването чрез избягване на капаните, свързани с високоскоростните въздушни течения.


Както може да се види, подходът на свободното охлаждане се върти около ефективното използване на външния въздух, като дава приоритет на контролирана ниска вътрешна въздушна скорост. Тази умишлена стратегия помага за поддържането на ламинарен и равномерен въздушен поток, осигурявайки ефективността на охлаждането на ИТ оборудването.


Концепция на сградата

В парадигмата на свободното охлаждане традиционните въздуховоди не се използват в структурата на сградата. За разлика от конвенционалните настройки с определени въздуховоди в стени, тавани или специфични зони, центровете за обработка на данни възприемат нетрадиционен подход. Самата сграда е замислена като въздуховод, което прави традиционните климатични инсталации остарели. Големият мащаб на тези въздуховоди ги превръща в неразделни компоненти на помещения и подове.


Схематично изображение на дизайна на сградата със свободно охлаждане


Процесът на въздушния поток започва, когато външен въздух навлиза в сградата, преминавайки през два вида филтри – груби филтри и фини филтри. След като въздухът премине процеса на почистване, той се задвижва от вентилатори в обширни обеми на сградата, приблизително еквивалентни на четири етажа на височина. Този значителен обем служи на собствената си цел: да забави въздушния поток, намалявайки скоростта му до необходимия диапазон от 1-2 метра в секунда. Впоследствие въздухът се спуска в машинното помещение.


След преминаване през машинното отделение, въздухът продължава пътуването си през ИТ стелажи, напредвайки към горещата пътека. Оттам той навлиза в колектора за горещ въздух, преди да бъде изхвърлен навън чрез смукателни вентилатори. Този структуриран път на въздушния поток осигурява ефективен процес на охлаждане, като същевременно поддържа контролирана въздушна скорост.


Въздушна скорост и обем

Преднамереният избор на дизайн за използване на обширни обеми на сградата служи за двойна цел. Първо и най-важно, той позволява постепенно намаляване на въздушната скорост, като гарантира, че въздушният поток достига желаната скорост от 1-2 метра в секунда. Тази контролирана въздушна скорост е от съществено значение за предотвратяване на турбуленция и поддържане на ламинарен поток, особено важно, когато въздухът преминава през чувствително ИТ оборудване. Второ, значителният обем побира необходимия обем въздух за ефективно разсейване на генерираната топлина. Синхронизираното взаимодействие на въздушна скорост и обем допринася за цялостния успех на системата.


Диференциалното налягане като единствен двигател за управление

При настройка за свободно охлаждане ние нямаме контрол върху външната температура на въздуха, което води до вариации в температурата на въздуха, влизащ в центъра за данни (DC). Въпреки това оценката на необходимия въздушен поток за охлаждане на оборудването е от съществено значение. За да се справим с това, ние разчитаме на метода на диференциалното налягане.


Във всяка ИТ стойка сървърите с вътрешни вентилатори работят с различни скорости, като заедно създават диференциално налягане между предната и задната част на стойката. С множество сървъри, всеки от които допринася за общия въздушен поток, тази разлика в налягането постепенно се натрупва между студените и горещите коридори. Използвайки сензори за налягане в двата коридора и извън сградата на DC, можем да измерим това диференциално налягане.


Изчислението включва изваждане на данните от сензора за налягане в горещия коридор от атмосферното налягане и изваждане на данните от сензора за налягане в студения коридор от атмосферното налягане. Така както в примера по-долу:


Пример от реалния свят


След това получените стойности ни насочват при определяне на необходимото подаване на въздух към DC и необходимото изпускане за компенсиране на работата на сървърните вентилатори. С по-прости думи, ние измерваме нуждите си от въздушен поток въз основа на разликите в налягането, което ни позволява да управляваме ефективно процеса на охлаждане в рамките на DC.


Камера за нагряване и смесване

Традиционните отоплителни системи обикновено не се прилагат в центрове за данни с естествено охлаждане. Използването на вода се счита за нерационално поради разходите и потенциалните рискове за оборудването. Това представлява предизвикателство по време на екстремни студове, достигащи -20–30 градуса навън. Докато оборудването се справя добре, инженерите търсят по-щадящ подход. Най-елегантното и логично решение тук е повторното използване на горещия въздух, генериран от ИТ оборудването. Насочвайки горещия въздух от сървърите в смесителна камера и връщайки част от него в основния въздушен поток, системата поддържа топлината на помещенията през зимата и позволява да се спестят разходи за отопление.


Простота и надеждност

Ключова теза в теорията за надеждността твърди, че простотата ражда надеждност. Това важи за системата за свободно охлаждане, която е забележително проста концепция. Системата функционира като барикада, вкарвайки въздух отвън през филтри, преминавайки го през ИТ оборудване и след това просто го изхвърля.


Липсата на сложни системи повишава надеждността, като само вентилаторите представляват уязвимост при горещо време. Подходът на свободното охлаждане е пример за радикално опростяване на системата, като значително подобрява надеждността чрез намаляване на броя на елементите.


DC фенове срещу сървърни фенове

Йерархичният авторитет на вентилаторите е друг основен въпрос в динамиката на въздушния поток в DC. Както обсъдихме, има големи фенове на ниво DC и такива на ниво сървър. Въпросът е: вентилаторите на центъра за данни просто доставят ли въздух, оставяйки вентилаторите на сървъра да консумират толкова, колкото е необходимо? Или търсенето идва от феновете на сървъра, принуждавайки феновете на DC да изпълнят техните изисквания?


Механизмът е следният: водеща роля в този процес имат сървърните вентилатори, които определят необходимия въздушен поток. Впоследствие DC вентилаторите реагират, като доставят необходимия обем въздух. Става очевидно, че ако кумулативното търсене от всички сървъри надхвърли капацитета на захранване на DC вентилатора, това може да доведе до потенциално прегряване.

Така че отговорът е, че сървърните фенове имат предимството в тази динамика. Те организират въздушния поток, като определят необходимото количество въздух.


Ефективност и изчисляване на PUE

За да се оцени ефективността на DC проект, традиционно се използва изчисляването на ефективността на потреблението на енергия (PUE). Формулата за PUE е съотношението на общата мощност на съоръжението към мощността на ИТ оборудването:


PUE = Обща мощност на съоръженията / Мощност на ИТ оборудването


В идеалния случай той е равен на 1, което означава, че цялата енергия е насочена към ИТ оборудване без никакви загуби. Въпреки това, постигането на този перфектен сценарий е рядкост в проекти в реалния свят.


Друг проблем възниква, когато се опитваме да установим ясна методология за изчисляване на ефективността на използване на енергия (PUE). Така например в нашата система имаме метрика, показваща моментната консумация на енергия във ватове, което прави възможно изчисляването на PUE в реално време.


Освен това можем да извлечем средна PUE за годишен период, която предлага по-изчерпателна оценка, като се вземат предвид сезонните колебания. Това е особено уместно предвид несъответствието в потреблението на енергия между сезоните; например несъответствието в изискванията за охлаждане между летните и зимните месеци. Това означава, че ако искаме да имаме по-надеждна оценка, трябва да дадем приоритет на средна годишна оценка, осигуряваща по-балансирана и цялостна оценка.


Също така е важно да се изследва PUE не само от гледна точка на енергия, но и на парични единици, като по този начин се включват сезонните колебания на цените на електроенергията. Оценяването на PUE в парично изражение дава по-цялостен поглед върху оперативната ефективност.


Освен това този подход разкрива възможности за постигане на стойност на PUE по-малка от 1, измерена в долари. Това става възможно, например, когато използваме отпадна топлина за отопление на вода и я продаваме по-нататък в близките градове. Забележителни примери, като центъра за данни на Google в САЩ и съоръжението на Yandex във Финландия, демонстрират жизнеспособността на подобни практики, особено в региони, характеризиращи се с високи разходи за енергия.


Ефективност срещу надеждност

Притесненията относно намаляването на разходите и увеличаването на ефективността често повдигат въпроси относно потенциалните отрицателни въздействия върху надеждността. Бих искал обаче да подчертая, че при свободното охлаждане стремежът към ефективност не прави компромис с надеждността. Вместо това неговите технологични странични ефекти могат дори да подобрят ефективността. Например, както вече обсъдихме, пренасочването на излишната топлина към термопомпи за допълнителни ползи, като например генериране на топла вода за близките градове, се превръща във финансово изгодна практика, без да се жертва надеждността.



Бъдещето на свободното охлаждане

Въпреки всички предимства, които безплатното охлаждане предлага, индустрията на центровете за данни все още се ръководи от консервативен подход и изисква доказана надеждност, с тенденция да се противопоставя на иновативните решения. Разчитането на сертификати от органи като Uptime Institute за маркетинг представлява друго препятствие за решенията за безплатно охлаждане, липсата на установено сертифициране, което кара търговските доставчици да ги гледат със скептицизъм.


И все пак има тенденция сред корпоративните хипермащабри да приемат свободното охлаждане като основно решение за своите DC. С нарастващ брой компании, които признават рентабилността и оперативните предимства на тази технология, ние очакваме през следващите 10-20 години да се появят повече центрове за данни без корпоративно охлаждане.