paint-brush
Optimalizace efektivity datového centra: Hluboký ponor do technik volného chlazenípodle@egorkaritskii
100,098 čtení
100,098 čtení

Optimalizace efektivity datového centra: Hluboký ponor do technik volného chlazení

podle Egor Karitskii10m2024/05/14
Read on Terminal Reader
Read this story w/o Javascript

Příliš dlouho; Číst

Objevte transformační potenciál technologie volného chlazení v datových centrech a prozkoumejte její výhody, výzvy a dopad na efektivitu a spolehlivost. Prozkoumejte, jak toto zelené řešení přináší revoluci ve strategiích chlazení a utváří budoucnost provozu datových center.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail

Coin Mentioned

Mention Thumbnail
featured image - Optimalizace efektivity datového centra: Hluboký ponor do technik volného chlazení
Egor Karitskii HackerNoon profile picture
0-item
1-item


V předchozím článku jsme diskutovali o rychlém rozšiřování infrastruktury datových center ao zvýšení spotřeby elektrické energie, které to mělo za následek. Protože servery během provozu přeměňují elektřinu na teplo, zvládání vysokých teplot a chlazení zařízení i vybavení datového centra se stává problémem číslo 1. pro týmy DC.


Zatímco tradiční způsoby chlazení, včetně klimatizací a chladičů, účinně chladí prostory a servery datových center, jejich nákladnost zůstává významnou nevýhodou. Volné chlazení na rozdíl od tradičních metod nevyžaduje značné investice, ale nabízí stejnou úroveň účinnosti a spolehlivosti. V tomto článku uvedu podrobný přehled technologie volného chlazení, zdůrazní její výhody, omezení a požadavky na úspěšnou implementaci.


Fyzika volného chlazení

Abychom porozuměli fyzice za volným chlazením, musíme se znovu podívat na vzorec tepelné energie:


Q = mcAT


Zde „Q“ představuje množství získaného nebo ztraceného tepla, „m“ znamená hmotnost vzorku (v našem případě hmotnost vzduchu v datovém centru), „c“ označuje specifickou tepelnou kapacitu vzduchu, a ΔT znamená teplotní rozdíl.


V datovém centru je primárním zdrojem tepla CPU. Obvykle se jedná o 2 až 4 CPU, každý s výkonem přibližně 200 wattů. Jak bylo uvedeno výše, veškerá elektrická energie spotřebovaná CPU se přeměňuje na teplo. Proto například se 2 CPU generujeme 400 wattů tepla, které je třeba odvést. Nyní je naším cílem určit množství vzduchu potřebného pro tento účel.


Parametr ΔT neboli teplotní diferenciál udává, že čím nižší je teplota venkovního vzduchu, tím menší množství vzduchu je potřeba k chlazení CPU. Pokud je například teplota vstupního vzduchu 0 °C a výstupní teplota 35 °C, ΔT by bylo pouze 35, což znamená spíše nižší požadavek na vzduchovou hmotu. Během letní sezóny se však chlazení stává náročnějším kvůli rostoucím okolním teplotám. Čím vyšší je venkovní teplota, tím větší množství vzduchu bude potřeba pro chlazení serverů.



Omezení teploty serveru a síťových komponent

Ačkoli volné chlazení může být účinné pro mírné a chladné podnebí, stále má omezení kvůli teplotním omezením serverových komponent. Kritické komponenty v IT a síťových zařízeních, jako jsou procesory, RAM, HDD, SSD a NVMe disky, mají požadavky na provozní teplotu:


  • Procesory: max 89°C
  • RAM: max 75°C
  • HDD: max 50°C
  • SSD a NVMe disky: max 47-48°C


Tato omezení přímo ovlivňují vhodnost venkovní teploty vzduchu pro chlazení. Bezplatné chlazení by nebylo životaschopné v oblastech, kde venkovní teploty překračují tyto prahové hodnoty nebo se jim dokonce blíží, protože by mohlo dojít k poškození systému v důsledku přehřátí. Regionální omezení

Jak jsme již vysvětlili, venkovní teploty musí trvale zůstat nižší než maximální provozní teploty IT zařízení, aby bylo volné chlazení účinné. To vyžaduje pečlivé zvážení klimatických podmínek umístění DC. Organizace musí analyzovat dlouhodobé předpovědi počasí, aby zajistily, že teploty nepřekročí požadované prahové hodnoty, a to ani v konkrétních dnech nebo hodinách. Vzhledem k dlouhé životnosti datových center (obvykle 10–15 let) by navíc při rozhodování o umístění měly být zohledněny i účinky globálního oteplování.



Požadavky na architekturu uzlu serveru

V kontextu fyziky závisí dosažení účinného chlazení na serverech na zajištění dostatečného proudění vzduchu systémem. Architektura serveru hraje v tomto procesu důležitou roli.


Příklad serverové architektury s ventilačními otvory, které usnadňují potřebné proudění vzduchu a umožňují efektivní volné chlazení


Naopak servery postrádající vhodné konstrukční prvky, jako jsou perforace nebo otvory, mohou bránit proudění vzduchu a potenciálně ohrozit celkovou účinnost mechanismu volného chlazení.


Regulace vlhkosti

Úroveň vlhkosti je dalším kritickým faktorem, pokud jde o volné chlazení. Protože nemáme kontrolu nad vnější vlhkostí, vyvstávají dva související dotazy: za prvé, řešení úrovní vlhkosti blížící se nebo přesahující 100 % v datovém centru (DC); za druhé, řešení scénářů velmi nízké vlhkosti vzduchu, například během mrazivého únorového dne s venkovní teplotou -30 °C a relativní vlhkostí v rozmezí od 2 % do 5 %. Pojďme tyto situace systematicky prozkoumat.


V podmínkách zvýšené vlhkosti existuje společná obava ohledně možného výskytu kondenzace a jejích nepříznivých účinků na funkčnost zařízení. Na rozdíl od tohoto problému je v zónách zpětného chlazení DC, kde dochází k procesu chlazení, kondenzace vyloučena. To je způsobeno principem, že ke kondenzaci dochází, když se teplý, vlhký vzduch dostane do kontaktu s chladnějším povrchem. V rámci systému volného chlazení DC však žádný prvek není chladnější než okolní vzduch. V důsledku toho je kondenzace ze své podstaty bráněna, což eliminuje potřebu proaktivních opatření.


Naopak při nízké vlhkosti se obavy posouvají směrem k vytváření statické elektřiny, která představuje hrozbu pro stabilitu zařízení. Tento problém není spojen s kondenzací, ale vyžaduje zvláštní řešení. Zmírnění zahrnuje postupy uzemnění a aplikaci speciálního podlahového nátěru. Tato opatření jsou v souladu se zavedenými metodami ochrany vnitřního zařízení před statickou elektřinou. Uzemněním konstrukčních prvků, rozvaděčů a IT zařízení se statický náboj neškodně rozptýlí do země, čímž se zachová integrita zařízení.


V přirozeném klimatu jsou případy extrémně vysoké nebo nízké vlhkosti jen zřídka. Mezi významné výjimky patří vzácné události, jako je bouřka, která v červenci dosáhne 100% vlhkosti nebo silný mráz způsobující velmi nízkou vlhkost. Po většinu času však úrovně vlhkosti zůstávají v přijatelných mezích, které nepředstavují žádné poškození zařízení, a to i bez aktivních zásahů.


Množství a rychlost vzduchu

Jak jsme již uvedli, k usnadnění účinného chlazení potřebujeme značný objem vnějšího vzduchu. Současně se objevuje zdánlivě neintuitivní požadavek – udržení nízkého proudění vzduchu v budově. Tento zdánlivý paradox je zakořeněn v problémech, které představují vysokorychlostní proudy vzduchu cirkulující uvnitř.


Pro zjednodušení si představte vysokou rychlost vzduchu jako robustní proud z trubice, který kolem IT zařízení vytváří víry a turbulence. Tato turbulence potenciálně vede k nepravidelným pohybům vzduchu a lokalizovanému přehřívání. Abychom to vyřešili, strategicky usilujeme o celkovou nízkou rychlost vzduchu 1-2 metry za sekundu v celém prostoru.


Udržování této řízené rychlosti vzduchu nám umožňuje eliminovat turbulence. Vyšší rychlost by riskovala nepravidelnosti v pohybu vzduchu. Dodržením rozsahu 1-2 metry za sekundu podporujeme hladké, rovnoměrné proudění vzduchu, čímž se vyhneme místnímu přehřátí. Tato jemná rovnováha zajišťuje optimální chlazení IT zařízení tím, že se vyhýbá nástrahám spojeným s vysokorychlostními proudy vzduchu.


Jak je vidět, přístup volného chlazení se točí kolem efektivního využití vnějšího vzduchu při upřednostňování řízené nízké vnitřní rychlosti vzduchu. Tato promyšlená strategie pomáhá udržovat laminární a rovnoměrné proudění vzduchu a zajišťuje tak efektivitu chlazení IT zařízení.


Koncepce budovy

V paradigmatu volného chlazení nejsou v konstrukci budovy použity tradiční vzduchové kanály. Na rozdíl od konvenčních nastavení s určenými vzduchovými kanály ve stěnách, stropech nebo specifických oblastech, centra pro zpracování dat používají nekonvenční přístup. Samotná budova je koncipována jako vzduchotechnické potrubí, takže tradiční klimatizační jednotky jsou zastaralé. Naprostý rozsah těchto vzduchových kanálů je přeměňuje v nedílnou součást místností a podlah.


Schematické znázornění návrhu budovy s volným chlazením


Proces proudění vzduchu se zahájí, když vnější vzduch vstoupí do budovy a prochází dvěma typy filtrů – hrubými filtry a jemnými filtry. Jakmile vzduch projde procesem čištění, je poháněn ventilátory do rozsáhlých budov, přibližně ekvivalentních čtyřem podlažím na výšku. Tento značný objem slouží svému vlastnímu účelu: zpomalit proudění vzduchu a snížit jeho rychlost na požadovaný rozsah 1-2 metry za sekundu. Následně vzduch klesá do strojovny.


Po průchodu strojovnou vzduch pokračuje ve své cestě přes IT rozvaděče a postupuje do horké uličky. Odtud vstupuje do kolektoru horkého vzduchu, než je vytlačen ven přes odsávací ventilátory. Tato strukturovaná dráha proudění vzduchu zajišťuje účinný proces chlazení při zachování kontrolované rychlosti vzduchu.


Rychlost vzduchu a objem

Záměrná volba designu využití rozsáhlých stavebních objemů slouží dvojímu účelu. V první řadě umožňuje postupné snižování rychlosti vzduchu a zajišťuje, že proudění vzduchu dosáhne požadované rychlosti 1-2 metry za sekundu. Tato řízená rychlost vzduchu je nezbytná pro zabránění turbulencím a udržení laminárního proudění, což je zvláště důležité, když vzduch postupuje citlivým IT zařízením. Za druhé, významný objem pojme potřebný objem vzduchu k efektivnímu rozptýlení generovaného tepla. Synchronizovaná souhra vzdušné rychlosti a hlasitosti přispívá k celkovému úspěchu systému.


Diferenční tlak jako jediný řídicí ovladač

V nastavení volného chlazení nemáme kontrolu nad vnější teplotou vzduchu, což vede ke změnám teploty vzduchu vstupujícího do datového centra (DC). Navzdory tomu je odhad požadovaného průtoku vzduchu pro chlazení zařízení zásadní. Abychom to vyřešili, spoléháme na metodu diferenčního tlaku.


Uvnitř každého IT racku pracují servery s vnitřními ventilátory různými rychlostmi a společně vytvářejí rozdílový tlak mezi přední a zadní částí racku. S mnoha servery, z nichž každý přispívá k celkovému proudění vzduchu, se tento tlakový rozdíl postupně hromadí mezi studenou a horkou uličkou. Pomocí tlakových čidel v obou uličkách i mimo budovu DC můžeme měřit tento diferenční tlak.


Výpočet zahrnuje odečtení dat tlakového senzoru v horké uličce od atmosférického tlaku a odečtení dat tlakového senzoru ve studené uličce od atmosférického tlaku. Tedy jako v příkladu níže:


Příklad reálného světa


Výsledné hodnoty nás pak vedou při určování potřebného přívodu vzduchu do DC a požadovaného odvodu vzduchu pro kompenzaci chodu ventilátorů serveru. Jednodušeji řečeno, měříme naše potřeby proudění vzduchu na základě tlakových rozdílů, což nám umožňuje efektivně řídit proces chlazení v DC.


Topná a směšovací komora

Tradiční systémy vytápění se v datových centrech s volným chlazením obvykle neimplementují. Používání vody je považováno za iracionální kvůli nákladům a potenciálním rizikům pro zařízení. To představuje problém během extrémních mrazů, kdy venku dosahují -20–30 stupňů. Zatímco zařízení to zvládá dobře, inženýři hledají šetrnější přístup. Nejelegantnějším a nejlogičtějším řešením je zde opětovné využití horkého vzduchu generovaného IT zařízeními. Nasměrováním horkého vzduchu ze serverů do směšovací komory a vracením jeho části do hlavního proudu vzduchu systém udržuje prostory v zimě v teple a umožňuje šetřit náklady na vytápění.


Jednoduchost a spolehlivost

Klíčová teze v teorii spolehlivosti tvrdí, že jednoduchost plodí spolehlivost. To platí pro systém volného chlazení, který představuje pozoruhodně jednoduchý koncept. Systém funguje jako barikáda, která propouští vzduch zvenčí přes filtry, prochází přes IT zařízení a pak ho jen vyhání.


Absence složitých systémů zvyšuje spolehlivost, přičemž v horkém počasí představují zranitelnost pouze ventilátory. Přístup volného chlazení je příkladem radikálního zjednodušení systému, podstatně zlepšuje spolehlivost snížením počtu prvků.


DC Fanoušci vs Server Fanoušci

Hierarchická autorita ventilátorů je další zásadní otázkou v dynamice proudění vzduchu v DC. Jak jsme diskutovali, existují rozsáhlí fanoušci na úrovni DC a na úrovni serveru. Otázka zní: dodávají ventilátory datových center pouze vzduch, přičemž ventilátory serverů spotřebovávají tolik, kolik potřebují? Nebo pochází poptávka od fanoušků serveru a nutí fanoušky DC splnit jejich požadavky?


Mechanismus je následující: v tomto procesu hrají dominantní roli serverové ventilátory, které určují potřebné proudění vzduchu. Následně DC ventilátory reagují dodáním požadovaného objemu vzduchu. Je zřejmé, že pokud kumulativní poptávka ze všech serverů překročí kapacitu napájení DC ventilátoru, může to vést k potenciálnímu přehřátí.

Takže odpověď je, že fanoušci serveru mají v této dynamice primát. Organizují proudění vzduchu a určují potřebné množství vzduchu.


Výpočet účinnosti a PUE

K vyhodnocení účinnosti DC projektu se tradičně používá výpočet energetické účinnosti (PUE). Vzorec pro PUE je poměr celkového výkonu zařízení k výkonu IT zařízení:


PUE = celkový výkon zařízení / výkon zařízení IT


V ideálním případě se rovná 1, což znamená, že veškerá energie je směrována do IT zařízení bez jakéhokoli plýtvání. Dosažení tohoto dokonalého scénáře je však v projektech v reálném světě vzácné.


Další problém vyvstává, když se snažíme vytvořit jasnou metodiku pro výpočet efektivity využití energie (PUE). Tak například v našem systému máme metriku udávající okamžitou spotřebu energie ve wattech, která umožňuje vypočítat PUE v reálném čase.


Navíc můžeme odvodit průměrnou PUE za roční období, což nabízí komplexnější hodnocení s ohledem na sezónní výkyvy. To je zvláště důležité vzhledem k rozdílům ve spotřebě energie mezi sezónami; například rozdíl v požadavcích na chlazení mezi letními a zimními měsíci. To znamená, že pokud chceme mít spolehlivější hodnocení, musíme upřednostnit roční průměr poskytující vyváženější a komplexnější hodnocení.


Je také důležité prozkoumat PUE nejen z hlediska energie, ale také peněžních jednotek, a tím zahrnout sezónní výkyvy cen elektřiny. Hodnocení PUE v peněžním vyjádření poskytuje ucelenější pohled na provozní efektivitu.


Kromě toho tento přístup odhaluje možnosti, jak dosáhnout hodnoty PUE menší než 1 při měření v dolarech. Je to možné například tehdy, když odpadní teplo využijeme k ohřevu vody a dále ho prodáváme do okolních měst. Pozoruhodné příklady, jako je datové centrum společnosti Google v USA a zařízení společnosti Yandex ve Finsku, demonstrují životaschopnost takových postupů, zejména v regionech vyznačujících se vysokými náklady na energii.


Efektivita vs. spolehlivost

Obavy ze snižování nákladů a zvyšování efektivity často vyvolávají otázky o možných negativních dopadech na spolehlivost. Rád bych však zdůraznil, že u volného chlazení nesnižuje honba za účinností spolehlivost. Místo toho mohou jeho technologické vedlejší účinky dokonce zvýšit efektivitu. Například, jak jsme již diskutovali, přesměrování přebytečného tepla do tepelných čerpadel pro další výhody, jako je výroba teplé vody pro okolní města, se stává finančně výhodnou praxí, aniž by byla obětována spolehlivost.



Budoucnost volného chlazení

Navzdory všem výhodám, které bezplatné chlazení nabízí, je odvětví datových center stále řízeno konzervativním přístupem a vyžaduje osvědčenou spolehlivost s tendencí bránit se inovativním řešením. Spoléhání se na certifikace od orgánů, jako je např Uptime Institute pro marketing představuje další překážku pro řešení bezplatného chlazení, protože postrádá zavedenou certifikaci, což vede komerční poskytovatele k tomu, aby je vnímali skepticky.


Mezi firemními hyperscalery však existuje trend přijímat volné chlazení jako hlavní řešení pro jejich DC. S rostoucím počtem společností, které uznávají nákladovou efektivitu a provozní výhody této technologie, očekáváme, že v příštích 10–20 letech se objeví více datových center bez firemního chlazení.