V predchádzajúcom článku sme diskutovali o rýchlom rozšírení infraštruktúry dátových centier a náraste spotreby elektrickej energie, ktorý z toho vyplýva. Keďže servery počas prevádzky premieňajú elektrickú energiu na teplo, riadenie vysokých teplôt a chladenie zariadení a zariadení dátového centra sa stáva problémom číslo 1. pre tímy DC.
Zatiaľ čo tradičné spôsoby chladenia, vrátane klimatizácií a chladičov, efektívne ochladzujú priestory a servery dátových centier, ich nákladnosť zostáva významnou nevýhodou. Voľné chladenie na rozdiel od tradičných metód nevyžaduje značné investície, ale ponúka rovnakú úroveň účinnosti a spoľahlivosti. V tomto článku urobím podrobný prehľad technológie voľného chladenia, vyzdvihnúc jej výhody, obmedzenia a požiadavky na úspešnú implementáciu.
Aby sme pochopili fyziku voľného chladenia, budeme musieť prehodnotiť vzorec tepelnej energie:
Q = mcAT
„Q“ tu predstavuje množstvo získaného alebo strateného tepla, „m“ predstavuje hmotnosť vzorky (v našom prípade hmotnosť vzduchu v dátovom centre), „c“ označuje špecifickú tepelnú kapacitu vzduchu, a ΔT znamená teplotný rozdiel.
V dátovom centre je primárnym zdrojom tepla CPU. Zvyčajne existujú 2 až 4 procesory, z ktorých každý pracuje s výkonom približne 200 wattov. Ako už bolo uvedené, všetka elektrická energia spotrebovaná CPU sa premieňa na teplo. Preto napríklad s 2 CPU generujeme 400 wattov tepla, ktoré je potrebné rozptýliť. Teraz je naším cieľom určiť množstvo vzduchu potrebného na tento účel.
Parameter ΔT alebo teplotný rozdiel udáva, že čím nižšia je teplota vonkajšieho vzduchu, tým menej vzduchu je potrebné na chladenie CPU. Napríklad, ak je teplota vstupného vzduchu 0 °C a výstupná teplota 35 °C, ΔT by bolo len 35, čo znamená skôr nižšiu požiadavku na vzduchovú hmotu. Počas letnej sezóny sa však ochladzovanie stáva náročnejším v dôsledku stúpajúcich teplôt okolia. Čím vyššia je vonkajšia teplota, tým väčšie množstvo vzduchu bude potrebné na chladenie serverov.
Hoci voľné chladenie môže byť efektívne pre mierne a chladné podnebie, stále má obmedzenia v dôsledku teplotných obmedzení serverových komponentov. Kritické komponenty v IT a sieťových zariadeniach, ako sú procesory, RAM, HDD, SSD a NVMe disky, majú požiadavky na prevádzkovú teplotu:
Tieto obmedzenia priamo ovplyvňujú vhodnosť teplôt vonkajšieho vzduchu na chladenie. Voľné chladenie by nebolo životaschopné v regiónoch, kde vonkajšie teploty prekračujú tieto prahové hodnoty alebo sa k nim dokonca približujú, pretože by mohlo dôjsť k poškodeniu systému v dôsledku prehriatia. Regionálne obmedzenia
Ako sme už vysvetlili, vonkajšie teploty musia neustále zostať nižšie ako maximálne prevádzkové teploty IT zariadenia, aby bolo voľné chladenie účinné. To si vyžaduje starostlivé zváženie klimatických podmienok lokality DC. Organizácie musia analyzovať dlhodobé predpovede počasia, aby zabezpečili, že teploty neprekročia požadované prahové hodnoty, a to ani v konkrétnych dňoch alebo hodinách. Okrem toho, ak vezmeme do úvahy dlhú životnosť dátových centier (zvyčajne 10-15 rokov), pri rozhodovaní o umiestnení by sa mali zohľadniť aj účinky globálneho otepľovania.
V kontexte fyziky sa dosiahnutie efektívneho chladenia v serveroch spolieha na zabezpečenie dostatočného prúdenia vzduchu cez systém. Architektúra servera hrá v tomto procese dôležitú úlohu.
Naopak, servery, ktorým chýbajú vhodné konštrukčné prvky, ako sú perforácie alebo otvory, môžu brániť prúdeniu vzduchu a potenciálne ohroziť celkovú účinnosť mechanizmu voľného chladenia.
Úroveň vlhkosti je ďalším kritickým faktorom, pokiaľ ide o voľné chladenie. Keďže nemáme kontrolu nad vonkajšou vlhkosťou, vynárajú sa dve relevantné otázky: po prvé, riešiť úrovne vlhkosti blížiace sa alebo prekračujúce 100 % v dátovom centre (DC); po druhé, riešenie scenárov veľmi nízkej vlhkosti vzduchu, ako napríklad počas mrazivého februárového dňa s vonkajšou teplotou -30 °C a relatívnou vlhkosťou v rozmedzí od 2 % do 5 %. Poďme systematicky skúmať tieto situácie.
V podmienkach zvýšenej vlhkosti existuje spoločná obava týkajúca sa možného výskytu kondenzácie a jej nepriaznivých účinkov na funkčnosť zariadenia. Na rozdiel od tohto problému je v zónach spätného chladenia jednosmerného prúdu, kde prebieha proces chladenia, kondenzácia vylúčená. Je to spôsobené princípom, že kondenzácia vzniká, keď sa teplý, vlhký vzduch dostane do kontaktu s chladnejšími povrchmi. Avšak v rámci systému voľného chladenia DC nie je žiadny prvok chladnejší ako okolitý vzduch. V dôsledku toho je kondenzácii vo svojej podstate bránené, čím sa eliminuje potreba proaktívnych opatrení.
Naopak, pri nízkej vlhkosti sa obavy posúvajú smerom k vytváraniu statickej elektriny, čo predstavuje hrozbu pre stabilitu zariadenia. Tento problém nie je spojený s kondenzáciou, ale vyžaduje si osobitné riešenie. Zmiernenie zahŕňa postupy uzemnenia a aplikáciu špecializovaného podlahového náteru. Tieto opatrenia sú v súlade so zavedenými metódami ochrany vnútorného zariadenia pred statickou elektrinou. Uzemnením konštrukčných prvkov, stojanov a IT zariadení sa statický náboj neškodne rozptýli do zeme, čím sa zachová integrita zariadenia.
V prírodnej klíme sú prípady extrémne vysokej alebo nízkej vlhkosti len zriedka. Pozoruhodné výnimky zahŕňajú zriedkavé udalosti, ako je búrka, ktorá v júli dosiahne 100% vlhkosť alebo silný mráz spôsobujúci veľmi nízku vlhkosť. Avšak po väčšinu času zostávajú úrovne vlhkosti v prijateľných rozsahoch, ktoré nepoškodzujú zariadenie, a to aj bez aktívnych zásahov.
Ako sme už diskutovali, na uľahčenie efektívneho chladenia potrebujeme značný objem vonkajšieho vzduchu. Súčasne sa objavuje zdanlivo neintuitívna požiadavka – udržiavať nízke prúdenie vzduchu v budove. Tento zjavný paradox je zakorenený v problémoch, ktoré predstavujú vysokorýchlostné prúdy vzduchu cirkulujúce vo vnútri.
Pre zjednodušenie si predstavte vysokú rýchlosť vzduchu ako robustný prúd z trubice, ktorý okolo IT zariadení vytvára víry a turbulencie. Táto turbulencia potenciálne vedie k nepravidelným pohybom vzduchu a lokalizovanému prehriatiu. Aby sme to vyriešili, strategicky sa zameriavame na celkovú nízku rýchlosť vzduchu 1-2 metre za sekundu v celom priestore.
Udržiavanie tejto kontrolovanej rýchlosti vzduchu nám umožňuje eliminovať turbulencie. Vyššia rýchlosť by riskovala nepravidelnosti v pohybe vzduchu. Dodržiavaním rozsahu 1 – 2 metre za sekundu podporujeme plynulý, rovnomerný prúd vzduchu a vyhýbame sa lokálnemu prehriatiu. Táto jemná rovnováha zaisťuje optimálne chladenie IT zariadení vyhýbaním sa nástrahám spojeným s vysokorýchlostnými prúdmi vzduchu.
Ako je možné vidieť, prístup voľného chladenia sa točí okolo efektívneho využívania vonkajšieho vzduchu pri uprednostňovaní riadenej nízkej vnútornej rýchlosti vzduchu. Táto premyslená stratégia pomáha udržiavať laminárne a rovnomerné prúdenie vzduchu, čím zabezpečuje efektívnosť chladenia IT zariadení.
V paradigme voľného chladenia sa v konštrukcii budovy nepoužívajú tradičné vzduchové kanály. Na rozdiel od konvenčných nastavení s určenými vzduchovými kanálmi v stenách, stropoch alebo špecifických oblastiach, centrá spracovania údajov využívajú nekonvenčný prístup. Samotná budova je koncipovaná ako vzduchotechnické potrubie, čím sú tradičné klimatizačné jednotky zastarané. Už samotná škála týchto vzduchových kanálov ich premieňa na neoddeliteľnú súčasť miestností a podláh.
Proces prúdenia vzduchu sa spustí, keď vonkajší vzduch vstúpi do budovy a prechádza cez dva typy filtrov – hrubé filtre a jemné filtre. Akonáhle vzduch prejde procesom čistenia, ventilátory ho poháňajú do rozsiahlych budov, približne ekvivalentných štyrom podlažiam na výšku. Tento značný objem slúži svojmu vlastnému účelu: spomaliť prúdenie vzduchu a znížiť jeho rýchlosť na požadovaný rozsah 1-2 metre za sekundu. Následne vzduch klesá do strojovne.
Po prechode strojovňou vzduch pokračuje vo svojej ceste cez IT stojany a postupuje do horúcej uličky. Odtiaľ vstupuje do kolektora horúceho vzduchu a potom je vytlačený von cez odsávacie ventilátory. Táto štruktúrovaná dráha prúdenia vzduchu zaisťuje efektívny proces chladenia pri zachovaní kontrolovanej rýchlosti vzduchu.
Zámerná voľba dizajnu s použitím rozsiahlych stavebných objemov slúži na dvojaký účel. V prvom rade umožňuje postupné znižovanie rýchlosti vzduchu, čím sa zabezpečí, že prúdenie vzduchu dosiahne požadovanú rýchlosť 1-2 metre za sekundu. Táto riadená rýchlosť vzduchu je nevyhnutná na zabránenie turbulencii a udržanie laminárneho prúdenia, čo je obzvlášť dôležité, keď vzduch postupuje cez citlivé IT zariadenia. Po druhé, významný objem pojme potrebný objem vzduchu na efektívne odvádzanie generovaného tepla. Synchronizovaná súhra rýchlosti a hlasitosti prispieva k celkovému úspechu systému.
V nastavení voľného chladenia nemáme kontrolu nad vonkajšou teplotou vzduchu, čo vedie k zmenám teploty vzduchu vstupujúceho do dátového centra (DC). Napriek tomu je odhad požadovaného prietoku vzduchu na chladenie zariadenia nevyhnutný. Aby sme to vyriešili, spoliehame sa na metódu diferenčného tlaku.
Vo vnútri každého IT racku pracujú servery s vnútornými ventilátormi rôznymi rýchlosťami, čím spoločne vytvárajú rozdielový tlak medzi prednou a zadnou stranou racku. S mnohými servermi, z ktorých každý prispieva k celkovému prúdeniu vzduchu, sa tento tlakový rozdiel postupne zvyšuje medzi studenými a horúcimi uličkami. Pomocou tlakových snímačov v oboch uličkách a mimo budovy DC môžeme tento diferenčný tlak zmerať.
Výpočet zahŕňa odčítanie údajov snímača tlaku v horúcej uličke od atmosférického tlaku a odpočítanie údajov snímača tlaku v studenej uličke od atmosférického tlaku. Tak ako v príklade nižšie:
Príklad zo skutočného sveta
Výsledné hodnoty nás potom nasmerujú pri určovaní potrebného prívodu vzduchu do DC a požadovaného odsávania na kompenzáciu chodu ventilátorov servera. Zjednodušene povedané, meriame naše potreby prúdenia vzduchu na základe tlakových rozdielov, čo nám umožňuje efektívne riadiť proces chladenia v DC.
Tradičné vykurovacie systémy nie sú zvyčajne implementované v dátových centrách s voľným chladením. Používanie vody sa považuje za iracionálne vzhľadom na náklady a potenciálne riziká pre zariadenia. To predstavuje problém počas extrémnych prechladnutí, ktoré vonku dosahujú -20–30 stupňov. Aj keď to zariadenie zvláda dobre, inžinieri sa snažia o jemnejší prístup. Najelegantnejším a najlogickejším riešením je opätovné využitie horúceho vzduchu generovaného IT zariadeniami. Smerovaním horúceho vzduchu zo serverov do zmiešavacej komory a vrátením jeho časti do hlavného prúdu vzduchu systém udržuje priestory v zime v teple a umožňuje šetriť náklady na vykurovanie.
Kľúčová téza v teórii spoľahlivosti tvrdí, že jednoduchosť plodí spoľahlivosť. To platí pre systém voľného chladenia, ktorý predstavuje pozoruhodne jednoduchý koncept. Systém funguje ako barikáda, ktorá privádza vzduch zvonku cez filtre, prechádza cez IT zariadenia a potom ho len vytláča.
Absencia zložitých systémov zvyšuje spoľahlivosť, pričom v horúcom počasí predstavujú zraniteľnosť iba ventilátory. Prístup voľného chladenia je príkladom radikálneho zjednodušenia systému, ktorý podstatne zlepšuje spoľahlivosť znížením počtu prvkov.
Hierarchická autorita ventilátorov je ďalšou základnou otázkou v dynamike prúdenia vzduchu v DC. Ako sme už diskutovali, existujú rozsiahlí fanúšikovia na úrovni DC a fanúšikovia na úrovni servera. Otázka znie: dodávajú ventilátory dátového centra iba vzduch, pričom ventilátory servera spotrebúvajú toľko, koľko potrebujú? Alebo pochádza dopyt od fanúšikov servera a núti fanúšikov DC, aby splnili svoje požiadavky?
Mechanizmus je nasledovný: v tomto procese majú dominantnú úlohu ventilátory servera, ktoré určujú potrebný prietok vzduchu. Následne reagujú DC ventilátory dodávaním požadovaného objemu vzduchu. Je zrejmé, že ak kumulatívny dopyt zo všetkých serverov prekročí kapacitu napájania ventilátora DC, môže to viesť k potenciálnemu prehriatiu.
Takže odpoveď je, že fanúšikovia serverov majú v tejto dynamike prvenstvo. Organizujú prúdenie vzduchu a určujú potrebné množstvo vzduchu.
Na vyhodnotenie efektívnosti projektu jednosmerného prúdu sa tradične používa výpočet efektívnosti využitia energie (PUE). Vzorec pre PUE je pomer celkového výkonu zariadenia k výkonu IT zariadení:
PUE = celkový výkon zariadenia / výkon IT zariadení
V ideálnom prípade sa rovná 1, čo znamená, že všetka energia smeruje do IT zariadení bez akéhokoľvek plytvania. Dosiahnutie tohto dokonalého scenára je však v reálnych projektoch zriedkavé.
Ďalší problém vzniká, keď sa snažíme vytvoriť jasnú metodiku výpočtu efektívnosti využitia energie (PUE). Napríklad v našom systéme máme metriku označujúcu okamžitú spotrebu energie vo wattoch, ktorá umožňuje vypočítať PUE v reálnom čase.
Okrem toho môžeme odvodiť priemernú PUE za ročné obdobie, čo ponúka komplexnejšie hodnotenie vzhľadom na sezónne výkyvy. Toto je obzvlášť dôležité vzhľadom na rozdiely v spotrebe energie medzi ročnými obdobiami; napríklad rozdiel v požiadavkách na chladenie medzi letnými a zimnými mesiacmi. To znamená, že ak chceme mať spoľahlivejšie hodnotenie, musíme uprednostniť ročný priemer poskytujúci vyváženejšie a komplexnejšie hodnotenie.
Je tiež dôležité preskúmať PUE nielen z hľadiska energie, ale aj peňažných jednotiek, čím sa zohľadnia sezónne výkyvy cien elektriny. Hodnotenie PUE v peňažnom vyjadrení poskytuje holistickejší pohľad na prevádzkovú efektívnosť.
Okrem toho tento prístup odhaľuje možnosti dosiahnutia hodnoty PUE menšej ako 1 pri meraní v dolároch. Je to možné napríklad vtedy, keď odpadové teplo využívame na ohrev vody a predávame ho ďalej do okolitých miest. Pozoruhodné príklady, ako napríklad dátové centrum spoločnosti Google v USA a zariadenie spoločnosti Yandex vo Fínsku, dokazujú životaschopnosť takýchto praktík, najmä v regiónoch, ktoré sa vyznačujú vysokými nákladmi na energiu.
Obavy zo znižovania nákladov a zvyšovania efektívnosti často vyvolávajú otázky o možných negatívnych dopadoch na spoľahlivosť. Chcel by som však zdôrazniť, že pri voľnom chladení snaha o efektivitu neohrozuje spoľahlivosť. Namiesto toho môžu jeho technologické vedľajšie účinky dokonca zvýšiť efektivitu. Napríklad, ako sme už diskutovali, presmerovanie prebytočného tepla do tepelných čerpadiel za účelom získania dodatočných výhod, ako je napríklad výroba teplej vody pre okolité mestá, sa stáva finančne výhodnou praxou bez obetovania spoľahlivosti.
Napriek všetkým výhodám, ktoré ponúka bezplatné chladenie, je odvetvie dátových centier stále poháňané konzervatívnym prístupom a vyžaduje overenú spoľahlivosť s tendenciou odolávať inovatívnym riešeniam. Spoliehanie sa na certifikácie od orgánov, ako je napr
Napriek tomu medzi podnikovými hyperscalermi existuje trend prijímať bezplatné chladenie ako hlavné riešenie pre svoje DC. S rastúcim počtom spoločností, ktoré uznávajú nákladovú efektívnosť a prevádzkové výhody tejto technológie, očakávame, že v najbližších 10 – 20 rokoch sa objaví viac dátových centier bez firemného chladenia.