paint-brush
Duomenų centro efektyvumo optimizavimas: giliai pasinerkite į nemokamo aušinimo būduspateikė@egorkaritskii
100,000 skaitymai
100,000 skaitymai

Duomenų centro efektyvumo optimizavimas: giliai pasinerkite į nemokamo aušinimo būdus

pateikė Egor Karitskii10m2024/05/14
Read on Terminal Reader
Read this story w/o Javascript

Per ilgai; Skaityti

Atraskite nemokamo aušinimo technologijos transformacinį potencialą duomenų centruose, išnagrinėdami jos naudą, iššūkius ir poveikį efektyvumui bei patikimumui. Sužinokite, kaip šis ekologiškas sprendimas keičia aušinimo strategijas ir formuoja duomenų centrų veiklos ateitį.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail

Coin Mentioned

Mention Thumbnail
featured image - Duomenų centro efektyvumo optimizavimas: giliai pasinerkite į nemokamo aušinimo būdus
Egor Karitskii HackerNoon profile picture
0-item
1-item


Ankstesniame straipsnyje aptarėme sparčią duomenų centrų infrastruktūros plėtrą ir dėl to padidėjusį elektros energijos suvartojimą. Kadangi serveriai veikdami elektrą paverčia šiluma, aukštų temperatūrų valdymas ir duomenų centro įrenginių ir įrangos vėsinimas tampa svarbiausia problema. DC komandoms.


Nors tradiciniai vėsinimo metodai, įskaitant oro kondicionierius ir aušintuvus, efektyviai vėsina duomenų centro patalpas ir serverius, jų brangumas išlieka reikšmingu trūkumu. Laisvas aušinimas, priešingai nei tradiciniai metodai, nereikalauja didelių investicijų, tačiau užtikrina tokį patį efektyvumo ir patikimumo lygį. Šiame straipsnyje išsamiai apžvelgsiu nemokamo vėsinimo technologiją, pabrėždamas jos privalumus, apribojimus ir sėkmingo diegimo reikalavimus.


Laisvo aušinimo fizika

Norėdami suprasti laisvo aušinimo fiziką, turėsime dar kartą peržiūrėti šilumos energijos formulę:


Q = mcΔT


Čia „Q“ reiškia gautą arba prarastą šilumos kiekį, „m“ reiškia mėginio masę (mūsų atveju oro masę duomenų centre), „c“ reiškia savitąją oro šiluminę talpą, o ΔT reiškia temperatūros skirtumą.


Duomenų centre pagrindinis šilumos šaltinis yra centrinis procesorius. Paprastai yra nuo 2 iki 4 procesorių, kurių kiekvienas veikia maždaug 200 vatų. Kaip aptarta anksčiau, visa procesorių sunaudota elektros energija paverčiama šiluma. Todėl, pavyzdžiui, su 2 procesoriais generuojame 400 vatų šilumos, kurią reikia išsklaidyti. Dabar mūsų tikslas yra nustatyti šiam tikslui reikalingą oro kiekį.


Parametras ΔT, arba temperatūrų skirtumas, rodo, kad kuo žemesnė lauko oro temperatūra, tuo mažiau oro masės reikia CPU aušinti. Pavyzdžiui, jei įeinančio oro temperatūra yra 0 °C, o išeinančio 35 °C, ΔT būtų tik 35, o tai reiškia, kad oro masės poreikis yra mažesnis. Tačiau vasaros sezono metu vėsinimas tampa sudėtingesnis dėl kylančios aplinkos temperatūros. Kuo aukštesnė lauko temperatūra, tuo daugiau oro reikės serverių vėsinimui.



Serverio ir tinklo komponentų temperatūros apribojimai

Nors nemokamas vėsinimas gali būti veiksmingas vidutinio ir šalto klimato sąlygomis, jis vis tiek turi apribojimų dėl serverio komponentų temperatūros apribojimų. Svarbiems IT ir tinklo įrangos komponentams, tokiems kaip procesoriai, RAM, HDD, SSD ir NVMe diskai, taikomi veikimo temperatūros reikalavimai:


  • Procesoriai: max 89°C
  • RAM: max 75°C
  • HDD: max 50°C
  • SSD ir NVMe diskai: max 47-48°C


Šie apribojimai tiesiogiai veikia lauko oro temperatūros tinkamumą vėsinti. Laisvas vėsinimas nebūtų gyvybingas regionuose, kur lauko temperatūra viršija šias ribas ar net priartėja prie jų, nes dėl perkaitimo gali būti pažeista sistema. Regioniniai apribojimai

Kaip jau paaiškinome, lauko temperatūra turi nuolat išlikti žemesnė už IT įrangos maksimalią darbinę temperatūrą, kad laisvas vėsinimas būtų efektyvus. Tam reikia atidžiai apsvarstyti nuolatinės srovės vietos klimato sąlygas. Organizacijos turi analizuoti ilgalaikes orų prognozes, siekdamos užtikrinti, kad temperatūra neviršytų reikiamų slenksčių net ir tam tikromis dienomis ar valandomis. Be to, atsižvelgiant į ilgą duomenų centrų eksploatavimo laiką (paprastai 10–15 metų), į visuotinio atšilimo poveikį taip pat reikėtų atsižvelgti priimant sprendimus dėl vietos.



Serverio mazgo architektūros reikalavimai

Kalbant apie fiziką, efektyvus serverių aušinimas priklauso nuo pakankamo oro srauto per sistemą užtikrinimo. Šiame procese svarbų vaidmenį vaidina serverio architektūra.


Serverio architektūros pavyzdys su ventiliacijos angomis, kurios palengvina reikiamą oro srautą ir leidžia efektyviai laisvai vėsinti


Ir atvirkščiai, serveriai, neturintys tinkamų dizaino savybių, pvz., perforacijų ar angų, gali trukdyti oro srautui, o tai gali pakenkti bendram laisvojo aušinimo mechanizmo efektyvumui.


Drėgmės kontrolė

Drėgmės lygis yra dar vienas svarbus veiksnys, kai kalbama apie laisvą aušinimą. Kadangi nekontroliuojame išorinių drėgmės sąlygų, kyla du svarbūs klausimai: pirma, dėl drėgmės lygio, artėjančio arba viršijančio 100 % duomenų centre (DC); antra, sprendžiant labai žemos oro drėgmės scenarijus, pvz., šaltą vasario dieną, kai lauko temperatūra –30°C, o santykinė oro drėgmė svyruoja nuo 2 % iki 5 %. Sistemingai išnagrinėkime šias situacijas.


Padidėjusios drėgmės sąlygomis bendras susirūpinimas dėl galimo kondensato susidarymo ir neigiamo jo poveikio įrangos funkcionalumui. Priešingai šiam susirūpinimui, nuolatinės srovės aušinimo zonose, kur vyksta aušinimo procesas, kondensatas neleidžiamas. Taip yra dėl principo, kad kondensatas susidaro, kai šiltas, drėgnas oras liečiasi su šaltesniais paviršiais. Tačiau laisvojo nuolatinės srovės aušinimo sistemoje joks elementas nėra šaltesnis už aplinkinį orą. Todėl kondensatas iš prigimties trukdo, todėl nereikia imtis aktyvių priemonių.


Priešingai, esant žemai drėgmei, nuogąstavimas pereina prie statinės elektros generavimo, o tai kelia grėsmę įrangos stabilumui. Ši problema nesusijusi su kondensatu, bet reikalauja išskirtinio sprendimo. Sušvelninimas apima įžeminimo procedūras ir specialios grindų dangos naudojimą. Šios priemonės atitinka nustatytus metodus, skirtus vidinei įrangai apsaugoti nuo statinės elektros. Įžeminus konstrukcinius elementus, stelažus ir IT įrangą, statinis krūvis nekenksmingai išsklaido žemę, išsaugant įrangos vientisumą.


Esant natūraliam klimatui, retai pasitaiko itin didelės arba mažos drėgmės. Reikšmingos išimtys apima retus įvykius, tokius kaip perkūnija, kai liepos mėnesį pasiekia 100 % drėgmės, arba stiprus šalnas, sukeliantis labai mažą oro drėgnumą. Tačiau didžiąją laiko dalį drėgmės lygis išlieka priimtinų diapazonų ribose, nekeliantis jokios žalos įrangai, net ir nesant aktyvių intervencijų.


Oro kiekis ir greitis

Kaip jau aptarėme, norint palengvinti efektyvų aušinimą, mums reikia didelio kiekio išorinio oro. Kartu iškyla iš pažiūros priešingas reikalavimas – išlaikyti žemą oro srautą pastate. Šis akivaizdus paradoksas kyla iš iššūkių, kuriuos kelia didelės spartos oro srovės, cirkuliuojančios viduje.


Norėdami supaprastinti, įsivaizduokite didelį oro greitį kaip tvirtą srautą iš vamzdžio, sukuriantį sūkurius ir turbulenciją aplink IT įrangą. Ši turbulencija gali sukelti nereguliarų oro judėjimą ir vietinį perkaitimą. Siekdami išspręsti šią problemą, strategiškai siekiame, kad visoje erdvėje bendras mažas oro greitis būtų 1–2 metrai per sekundę.


Palaikydami šį kontroliuojamą oro greitį galime pašalinti turbulenciją. Didesnis greitis gali sukelti oro judėjimo nelygumus. Laikydamiesi 1–2 metrų per sekundę diapazono, skatiname sklandų, vienodą oro srautą, išvengdami vietinio perkaitimo. Šis subtilus balansas užtikrina optimalų IT įrangos aušinimą, išvengiant spąstų, susijusių su didelės spartos oro srovėmis.


Kaip matyti, laisvo aušinimo metodas sukasi apie efektyvų išorinio oro naudojimą, o pirmenybė teikiama kontroliuojamam mažam vidiniam oro greičiui. Ši apgalvota strategija padeda išlaikyti laminarų ir vienodą oro srautą, užtikrinantį IT įrangos aušinimo efektyvumą.


Statybos koncepcija

Laisvo vėsinimo paradigmoje tradiciniai ortakiai pastato konstrukcijoje nenaudojami. Skirtingai nuo įprastų sąrankų su specialiais oro kanalais sienose, lubose ar konkrečiose vietose, duomenų apdorojimo centrai taiko netradicinį metodą. Pats pastatas suplanuotas kaip ortakis, todėl tradiciniai oro kondicionavimo įrenginiai paseno. Didelis šių ortakių mastas paverčia juos neatsiejama patalpų ir grindų dalimi.


Scheminis laisvo aušinimo pastato projekto vaizdas


Oro srauto procesas prasideda, kai į pastatą patenka išorinis oras, praeinantis per dviejų tipų filtrus – stambiuosius ir smulkiuosius filtrus. Kai oras yra išvalomas, ventiliatoriais jis išstumiamas į didelius pastato tūrius, maždaug lygius keturių aukštų aukščiui. Šis didelis tūris atlieka savo tikslą: sulėtinti oro srautą, sumažinant jo greitį iki reikiamo 1-2 metrų per sekundę diapazono. Vėliau oras nusileidžia į mašinų skyrių.


Perskridęs mašinų patalpą, oras tęsia savo kelionę per IT stelažus ir eina į karštą koridorių. Iš ten jis patenka į karšto oro kolektorių, prieš išleidžiant į lauką per išmetimo ventiliatorius. Šis struktūrinis oro srauto kelias užtikrina efektyvų aušinimo procesą išlaikant kontroliuojamą oro greitį.


Oro greitis ir tūris

Sąmoningas projektinis pasirinkimas naudojant ekspansyvius pastatų tūrius turi dvejopą paskirtį. Visų pirma, tai leidžia palaipsniui mažinti oro greitį, užtikrinant, kad oro srautas pasiektų pageidaujamą 1-2 metrų per sekundę greitį. Šis kontroliuojamas oro greitis yra būtinas norint išvengti turbulencijos ir išlaikyti laminarinį srautą, ypač svarbu, kai oras sklinda per jautrią IT įrangą. Antra, didelis tūris talpina reikiamą oro kiekį, kad būtų efektyviai išsklaidyta generuojama šiluma. Sinchronizuota oro greičio ir garsumo sąveika prisideda prie bendros sistemos sėkmės.


Slėgio skirtumas kaip vienintelis valdymo variklis

Laisvo vėsinimo sąrankoje mes nekontroliuojame išorinės oro temperatūros, todėl į duomenų centrą (DC) patenkanti oro temperatūra gali skirtis. Nepaisant to, būtina įvertinti įrangos aušinimui reikalingą oro srautą. Norėdami tai išspręsti, pasikliaujame diferencinio slėgio metodu.


Kiekvienoje IT stovo viduje serveriai su vidiniais ventiliatoriais veikia skirtingu greičiu, kartu sukuriant slėgio skirtumą tarp stovo priekinės ir galinės dalies. Su daugybe serverių, kurių kiekvienas prisideda prie bendro oro srauto, šis slėgio skirtumas palaipsniui didėja tarp šalto ir karšto koridorių. Naudodami slėgio jutiklius abiejuose praėjimuose ir už nuolatinės srovės pastato ribų, galime išmatuoti šį slėgio skirtumą.


Skaičiavimas apima slėgio jutiklio duomenis karštame koridoriuje atimant iš atmosferos slėgio ir slėgio jutiklio duomenis šaltame koridoriuje iš atmosferos slėgio. Taigi, kaip toliau pateiktame pavyzdyje:


Realaus pasaulio pavyzdys


Gautos vertės padeda mums nustatyti reikiamą oro tiekimą į nuolatinės srovės šaltinį ir reikalingą išmetimą, kad kompensuotų serverio ventiliatorių darbą. Paprasčiau tariant, mes įvertiname oro srauto poreikius pagal slėgio skirtumus, todėl galime efektyviai valdyti aušinimo procesą nuolatinėje srovėje.


Šildymo ir maišymo kamera

Tradicinės šildymo sistemos dažniausiai neįdiegtos duomenų centruose su nemokamu vėsinimu. Vandens naudojimas laikomas neracionalu dėl išlaidų ir galimos rizikos įrangai. Tai yra iššūkis esant dideliems šalčiams, kai lauke siekia -20–30 laipsnių. Nors įranga puikiai susitvarko, inžinieriai siekia švelnesnio požiūrio. Elegantiškiausias ir logiškiausias sprendimas čia – pakartotinis IT įrangos generuojamo karšto oro panaudojimas. Karštą orą iš serverių nukreipdama į maišymo kamerą, o dalį grąžindama į pagrindinę oro srovę, sistema žiemą palaiko patalpų šilumą ir leidžia sutaupyti išlaidas šildymui.


Paprastumas ir patikimumas

Pagrindinė patikimumo teorijos tezė teigia, kad paprastumas gimdo patikimumą. Tai galioja laisvo aušinimo sistemai, kuri yra nepaprastai paprasta koncepcija. Sistema veikia kaip užtvara, per filtrus iš lauko orą praleidžianti per IT įrangą, o paskui tiesiog išstumianti.


Sudėtingų sistemų nebuvimas padidina patikimumą, nes karštu oru pažeidžiamumą kelia tik ventiliatoriai. Laisvo aušinimo metodas yra radikalaus sistemos supaprastinimo pavyzdys, iš esmės pagerinantis patikimumą sumažinus elementų skaičių.


DC gerbėjai prieš serverio gerbėjus

Ventiliatorių hierarchinė valdžia yra dar vienas esminis DC oro srauto dinamikos klausimas. Kaip jau aptarėme, yra didelio masto ventiliatoriai DC lygiu ir serverio lygiu. Kyla klausimas: ar duomenų centro ventiliatoriai tik tiekia orą, o serverio ventiliatoriai gali sunaudoti tiek, kiek reikia? O gal paklausa kyla iš serverio gerbėjų, verčiančių nuolatinės srovės gerbėjus įvykdyti savo reikalavimus?


Mechanizmas yra toks: šiame procese dominuojantis vaidmuo tenka serverio ventiliatoriams, kurie nustato reikiamą oro srautą. Vėliau nuolatinės srovės ventiliatoriai reaguoja tiekdami reikiamą oro kiekį. Akivaizdu, kad jei bendra visų serverių paklausa viršija nuolatinės srovės ventiliatoriaus tiekimo pajėgumus, tai gali sukelti perkaitimą.

Taigi atsakymas yra tas, kad serverio gerbėjai turi pirmenybę šioje dinamikoje. Jie organizuoja oro srautą, nurodydami reikiamą oro kiekį.


Efektyvumas ir PUE skaičiavimas

DC projekto efektyvumui įvertinti tradiciškai naudojamas energijos vartojimo efektyvumo (PUE) skaičiavimas. PUE formulė yra visos įrenginio galios ir IT įrangos galios santykis:


PUE = bendra įrenginio galia / IT įrangos galia


Idealiu atveju jis lygus 1, o tai reiškia, kad visa energija be jokio švaistymo nukreipiama į IT įrangą. Tačiau realaus pasaulio projektuose retai pavyksta pasiekti šį tobulą scenarijų.


Kita problema iškyla, kai bandome sukurti aiškią energijos vartojimo efektyvumo (PUE) skaičiavimo metodiką. Taigi, pavyzdžiui, savo sistemoje turime metriką, rodančią momentinį energijos suvartojimą vatais, kuri leidžia apskaičiuoti PUE realiuoju laiku.


Be to, galime gauti vidutinį PUE per metinį laikotarpį, o tai suteikia išsamesnį įvertinimą, atsižvelgiant į sezoninius svyravimus. Tai ypač svarbu atsižvelgiant į energijos naudojimo skirtumus tarp sezonų; pavyzdžiui, vėsinimo poreikių skirtumai tarp vasaros ir žiemos mėnesių. Tai reiškia, kad jei norime gauti patikimesnį vertinimą, pirmenybę turime teikti metiniam vidurkiui, kad būtų galima gauti labiau subalansuotą ir išsamesnį vertinimą.


Taip pat svarbu tirti PUE ne tik energijos, bet ir piniginių vienetų požiūriu, taip įtraukiant sezoninius elektros kainų svyravimus. PUE įvertinimas pinigine išraiška suteikia visapusiškesnę veiklos efektyvumo perspektyvą.


Be to, šis metodas atskleidžia galimybes pasiekti mažesnę nei 1 PUE vertę, matuojant doleriais. Tai tampa įmanoma, pavyzdžiui, panaudotą šilumą panaudojus vandens šildymui ir parduodant ją toliau į netoliese esančius miestus. Vertingi pavyzdžiai, tokie kaip „Google“ duomenų centras JAV ir „Yandex“ padalinys Suomijoje, rodo tokios praktikos gyvybingumą, ypač regionuose, kuriems būdingos didelės energijos sąnaudos.


Efektyvumas prieš patikimumą

Susirūpinimas dėl išlaidų mažinimo ir efektyvumo didinimo dažnai kelia klausimų dėl galimo neigiamo poveikio patikimumui. Tačiau noriu pabrėžti, kad laisvo aušinimo metu efektyvumo siekimas nepakenkia patikimumui. Vietoj to, jo technologinis šalutinis poveikis gali netgi padidinti efektyvumą. Pavyzdžiui, kaip jau aptarėme, šilumos pertekliaus nukreipimas į šilumos siurblius, siekiant papildomos naudos, pavyzdžiui, karšto vandens ruošimui šalia esantiems miestams, tampa finansiškai naudinga praktika, neprarandant patikimumo.



Nemokamo vėsinimo ateitis

Nepaisant visų nemokamo vėsinimo pranašumų, duomenų centrų pramonė vis dar vadovaujasi konservatyviu požiūriu ir reikalauja įrodyto patikimumo bei tendencijos priešintis naujoviškiems sprendimams. Pasitikėjimas sertifikatais iš tokių įstaigų kaip Uptime Institute rinkodara yra dar viena kliūtis nemokamiems vėsinimo sprendimams, nes nėra nustatyto sertifikavimo, todėl komerciniai tiekėjai į juos žiūri skeptiškai.


Vis dėlto tarp įmonių hiper-skalorių pastebima tendencija naudoti nemokamą aušinimą kaip pagrindinį savo nuolatinės srovės sprendimą. Didėjant įmonių skaičiui, pripažįstančių šios technologijos ekonomiškumą ir veiklos naudą, tikimės, kad per ateinančius 10–20 metų atsiras daugiau vėsinimo duomenų centrų be įmonių.