paint-brush
Optimering af datacentereffektivitet: Et dybt dyk i frikølingsteknikkerved@egorkaritskii
100,098 aflæsninger
100,098 aflæsninger

Optimering af datacentereffektivitet: Et dybt dyk i frikølingsteknikker

ved Egor Karitskii10m2024/05/14
Read on Terminal Reader
Read this story w/o Javascript

For langt; At læse

Opdag det transformative potentiale ved gratiskølingsteknologi i datacentre, undersøg dens fordele, udfordringer og indvirkning på effektivitet og pålidelighed. Udforsk, hvordan denne grønne løsning revolutionerer kølestrategier og former fremtiden for datacenterdrift.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail

Coin Mentioned

Mention Thumbnail
featured image - Optimering af datacentereffektivitet: Et dybt dyk i frikølingsteknikker
Egor Karitskii HackerNoon profile picture
0-item
1-item


I den forrige artikel diskuterede vi den hurtige udvidelse af datacenterinfrastrukturen og stigningen i elforbruget, det resulterede i. Da servere omdanner elektricitet til varme under drift, bliver håndtering af høje temperaturer og afkøling af både datacentrets faciliteter og udstyr et nummer 1 problem for DC-holdene.


Mens traditionelle kølemetoder, herunder klimaanlæg og kølere, effektivt køler datacenterlokaler og servere, er deres kostbarhed stadig en væsentlig ulempe. Frikøling i modsætning til traditionelle metoder kræver ikke væsentlige investeringer, men tilbyder samme niveau af effektivitet og pålidelighed. I denne artikel vil jeg lave en detaljeret oversigt over frikølingsteknologi, der fremhæver dens fordele, begrænsninger og kravene til en vellykket implementering.


Fysik af fri afkøling

For at forstå fysikken bag fri afkøling bliver vi nødt til at gense varmeenergiformlen:


Q = mcAT


Her repræsenterer 'Q' mængden af opnået eller tabt varme, 'm' står for massen af prøven (i vores tilfælde luftmassen i datacentret), 'c' angiver luftens specifikke varmekapacitet, og ΔT betegner temperaturforskellen.


I et datacenter er den primære varmekilde CPU'en. Typisk er der 2 til 4 CPU'er, der hver kører på cirka 200 watt. Som diskuteret tidligere, omdannes al elektrisk energi, der forbruges af CPU'erne, til varme. Derfor genererer vi for eksempel med 2 CPU'er 400 watt varme, som skal bortledes. Nu er vores mål at bestemme mængden af luft, der kræves til dette formål.


Parameteren ΔT, eller temperaturdifference, indikerer, at jo lavere udendørslufttemperaturen er, jo mindre luftmasse er nødvendig for at afkøle CPU'erne. For eksempel, hvis indgangslufttemperaturen er 0°C og udgangstemperaturen er 35°C, ville ΔT kun være 35, hvilket betyder et temmelig lavere krav til luftmasse. Men i sommersæsonen bliver afkøling mere udfordrende på grund af stigende omgivende temperaturer. Jo højere udendørstemperaturen er, desto større mængde luft kræves der til afkøling af serverne.



Server- og netværkskomponenters temperaturbegrænsninger

Selvom frikøling kan være effektiv til moderate og kolde klimaer, har den stadig begrænsninger på grund af temperaturbegrænsninger på serverkomponenter. Kritiske komponenter i it- og netværksudstyr, såsom processorer, RAM, HDD'er, SSD'er og NVMe-drev, har driftstemperaturkrav:


  • Processorer: max 89°C
  • RAM: maks. 75°C
  • HDD'er: maks. 50°C
  • SSD'er og NVMe-drev: maks. 47-48°C


Disse begrænsninger påvirker direkte egnetheden af udendørslufttemperaturer til køling. Frikøling ville ikke være levedygtig i områder, hvor udendørstemperaturer overstiger disse tærskler eller endda kommer tæt på dem, da det kan beskadige systemet på grund af overophedning. Regionale begrænsninger

Som vi allerede har forklaret, skal udendørstemperaturer konsekvent forblive lavere end IT-udstyrets maksimale driftstemperaturer, for at frikøling er effektiv. Dette nødvendiggør omhyggelig overvejelse af DC-lokationens klimaforhold. Organisationer skal analysere langsigtede vejrudsigter for at sikre, at temperaturerne ikke overstiger de krævede tærskler, selv på bestemte dage eller timer. I betragtning af datacentres lange levetid (typisk 10-15 år), bør virkningerne af global opvarmning også tages i betragtning i lokationsbeslutninger.



Server Node Arkitektur Krav

I forbindelse med fysik er opnåelse af effektiv køling i servere afhængig af at sikre en rigelig luftstrøm gennem systemet. Serverens arkitektur spiller en vigtig rolle i denne proces.


Et eksempel på serverarkitektur med ventilationshuller, der letter den nødvendige luftstrøm og muliggør effektiv frikøling


Omvendt kan servere, der mangler passende designfunktioner, såsom perforeringer eller åbninger, hæmme luftstrømmen, hvilket potentielt kompromitterer den overordnede effektivitet af frikølemekanismen.


Fugtkontrol

Luftfugtighedsniveauet er en anden kritisk overvejelse, når det kommer til frikøling. Da vi mangler kontrol over eksterne luftfugtighedsforhold, opstår der to relevante forespørgsler: For det første om luftfugtighedsniveauer, der nærmer sig eller overstiger 100 % i datacentret (DC); for det andet at tage fat på scenarier med meget lav luftfugtighed, såsom en frostklar februardag med en udendørstemperatur på -30°C og en relativ luftfugtighed på mellem 2% og 5%. Lad os systematisk undersøge disse situationer.


Under forhold med forhøjet luftfugtighed er der en fælles bekymring med hensyn til den potentielle forekomst af kondens og dens negative virkninger på udstyrets funktionalitet. I modsætning til denne bekymring er kondensering udelukket inden for DC'ens genafkølingszoner, hvor afkølingsprocessen finder sted. Dette skyldes princippet om, at kondens opstår, når varm, fugtig luft kommer i kontakt med koldere overflader. Men inden for DC'ens frikølesystem er intet element koldere end den omgivende luft. Kondensation er derfor i sagens natur hæmmet, hvilket eliminerer behovet for proaktive foranstaltninger.


På det modsatte, når man har at gøre med lav luftfugtighed, skifter bekymringen mod generering af statisk elektricitet, hvilket udgør en trussel mod udstyrets stabilitet. Dette problem er ikke forbundet med kondens, men kræver en markant løsning. Afbødning involverer jordforbindelsesprocedurer og påføring af en specialiseret gulvbelægning. Disse foranstaltninger stemmer overens med etablerede metoder til sikring af internt udstyr mod statisk elektricitet. Ved at jorde konstruktionselementer, stativer og it-udstyr spredes en statisk ladning uskadeligt til jorden, hvilket bevarer udstyrets integritet.


I det naturlige klima er tilfælde af ekstrem høj eller lav luftfugtighed sjældent. Bemærkelsesværdige undtagelser omfatter sjældne begivenheder såsom et tordenvejr, der opnår 100 % luftfugtighed i juli, eller en alvorlig frost, der forårsager meget lav luftfugtighed. Men i størstedelen af tiden forbliver luftfugtighedsniveauer godt inden for acceptable områder, som ikke forårsager nogen skade på udstyret, selv i fravær af aktive indgreb.


Luftmængde og hastighed

Som vi allerede har diskuteret, har vi brug for en betydelig mængde ekstern luft for at lette effektiv afkøling. Samtidig opstår et tilsyneladende kontraintuitivt krav – at opretholde en lav luftstrøm i bygningen. Dette tilsyneladende paradoks er forankret i de udfordringer, som højhastighedsluftstrømme cirkulerer indeni.


For at forenkle, forestil dig høj lufthastighed som en robust strøm fra et rør, der skaber hvirvler og turbulens omkring it-udstyret. Denne turbulens fører potentielt til uregelmæssige luftbevægelser og lokal overophedning. For at imødegå dette sigter vi strategisk efter en samlet lav flyvehastighed på 1-2 meter i sekundet i hele rummet.


Ved at opretholde denne kontrollerede lufthastighed kan vi eliminere turbulens. En højere hastighed ville risikere uregelmæssigheder i luftbevægelsen. Ved at overholde intervallet 1-2 meter pr. sekund fremmer vi en jævn, ensartet luftstrøm og undgår lokal overophedning. Denne delikate balance sikrer optimal afkøling af it-udstyr ved at omgå faldgruber forbundet med højhastighedsluftstrømme.


Som det kan ses, drejer frikølingstilgangen sig om effektiv brug af ekstern luft, samtidig med at en kontrolleret lav intern lufthastighed prioriteres. Denne bevidste strategi hjælper med at opretholde en laminær og ensartet luftstrøm, hvilket sikrer effektiviteten af køling af it-udstyr.


Bygningskoncept

I frikølingsparadigmet anvendes traditionelle luftkanaler ikke i bygningens struktur. I modsætning til konventionelle opsætninger med udpegede luftkanaler i vægge, lofter eller specifikke områder, anvender databehandlingscentre en ukonventionel tilgang. Selve bygningen er tænkt som en luftkanal, hvilket gør traditionelle klimaanlæg forældede. Den store skala af disse luftkanaler forvandler dem til integrerede komponenter i rum og gulve.


En skematisk afbildning af det frikølende bygningsdesign


Luftstrømningsprocessen starter, når ekstern luft kommer ind i bygningen og passerer gennem to typer filtre - grovfiltre og fine filtre. Når luften gennemgår renseprocessen, drives den af ventilatorer ind i ekspansive bygningsvolumener, omtrent svarende til fire etager i højden. Dette betydelige volumen tjener sit eget formål: at bremse luftstrømmen og reducere dens hastighed til det nødvendige område på 1-2 meter i sekundet. Efterfølgende går luften ned til maskinrummet.


Efter at have krydset maskinrummet, fortsætter luften sin rejse gennem IT-stativer og går videre ind i den varme gang. Derfra kommer den ind i varmluftssamleren, inden den bliver udstødt udenfor gennem udsugningsventilatorer. Denne strukturerede luftstrømsbane sikrer en effektiv afkølingsproces, samtidig med at kontrolleret lufthastighed opretholdes.


Lufthastighed og volumen

Det bevidste designvalg med at bruge ekspansive bygningsvolumener tjener et dobbelt formål. Først og fremmest giver det mulighed for en gradvis reduktion af flyvehastigheden, hvilket sikrer, at luftstrømmen opnår den ønskede hastighed på 1-2 meter i sekundet. Denne kontrollerede lufthastighed er afgørende for at forhindre turbulens og opretholde et laminært flow, især vigtigt, når luften bevæger sig gennem følsomt it-udstyr. For det andet rummer det betydelige volumen det nødvendige luftvolumen til at sprede den genererede varme effektivt. Det synkroniserede samspil mellem lufthastighed og volumen bidrager til systemets overordnede succes.


Differenstryk som den eneste ledelsesdriver

I et frikølingssetup har vi ikke kontrol over den eksterne lufttemperatur, hvilket fører til variationer i lufttemperaturen, der kommer ind i Datacenteret (DC). På trods af dette er det afgørende at estimere den nødvendige luftstrøm til udstyrskøling. For at løse dette er vi afhængige af metoden til differenstryk.


Inde i hvert IT-rack fungerer servere med interne blæsere ved forskellige hastigheder, hvilket tilsammen skaber et differenstryk mellem rackets for- og bagside. Med adskillige servere, der hver især bidrager til den samlede luftstrøm, opbygges denne trykforskel gradvist mellem de kolde og varme gange. Ved hjælp af tryksensorer i både gange og uden for DC-bygningen kan vi måle dette differenstryk.


Beregningen involverer at trække tryksensordataene i den varme gang fra atmosfærisk tryk og trække tryksensordataene i den kolde gang fra atmosfærisk tryk. Således som i eksemplet nedenfor:


Eksempel fra den virkelige verden


De resulterende værdier guider os derefter til at bestemme den nødvendige lufttilførsel til DC og den nødvendige udstødning for at udligne serverblæsernes drift. I enklere termer måler vi vores luftstrømsbehov baseret på trykforskellene, hvilket giver os mulighed for at styre køleprocessen i DC effektivt.


Varme- og blandekammer

De traditionelle varmesystemer er normalt ikke implementeret i datacentre med frikøling. Brug af vand anses for irrationelt på grund af omkostninger og potentielle risici for udstyr. Dette udgør en udfordring under ekstreme forkølelser, når -20-30 grader udenfor. Mens udstyret håndterer det godt, søger ingeniører en blidere tilgang. Den mest elegante og logiske løsning her er at genbruge varm luft genereret af it-udstyr. Ved at lede den varme luft fra servere ind i et blandekammer og returnere en del af den til hovedluftstrømmen, holder systemet lokalerne varme om vinteren og giver mulighed for at spare omkostninger til opvarmning.


Enkelhed og pålidelighed

En nøgleafhandling inden for pålidelighedsteori hævder, at enkelhed afføder pålidelighed. Dette gælder for det frie kølesystem, der står som et bemærkelsesværdigt simpelt koncept. Systemet fungerer som en barrikade, der fører luft udefra gennem filtre, passerer det gennem it-udstyr og så bare udstøder det.


Fraværet af komplekse systemer øger pålideligheden, hvor kun ventilatorer udgør en sårbarhed i varmt vejr. Frikølingstilgangen eksemplificerer radikal systemforenkling, hvilket væsentligt forbedrer pålideligheden ved at reducere antallet af elementer.


DC Fans vs Server Fans

Ventilatorernes hierarkiske autoritet er et andet grundlæggende spørgsmål i dynamikken i luftstrømmen i DC'er. Som vi har diskuteret, er der store fans på DC-niveau og dem på serverniveau. Spørgsmålet er: leverer datacenterventilatorerne kun luft, så serverens blæsere forbruge så meget som nødvendigt? Eller stammer efterspørgslen fra serverblæserne, hvilket tvinger DC-blæserne til at opfylde deres krav?


Mekanismen er som følger: serverblæserne har en dominerende rolle i denne proces, idet de bestemmer den nødvendige luftstrøm. Efterfølgende reagerer DC-ventilatorerne ved at levere den nødvendige mængde luft. Det bliver tydeligt, at hvis den kumulative efterspørgsel fra alle servere overstiger DC-blæserens forsyningskapacitet, kan det føre til potentiel overophedning.

Så svaret er, at serverfans har forrangen i denne dynamik. De orkestrerer luftstrømmen og specificerer den nødvendige luftmængde.


Beregning af effektivitet og PUE

For at evaluere effektiviteten af et DC-projekt bruges beregningen af Power Usage Effectiveness (PUE) traditionelt. Formlen for PUE er forholdet mellem Total Facility Power og IT-udstyr Power:


PUE = Total Facility Power / IT Udstyr Power


Ideelt set er det lig med 1, hvilket betyder, at al energi ledes til it-udstyr uden spild. At opnå dette perfekte scenarie er dog sjældent i projekter i den virkelige verden.


Et andet problem opstår, når vi forsøger at etablere en klar metode til beregning af Power Usage Effectiveness (PUE). Således besidder vi for eksempel i vores system en metrisk, der angiver det øjeblikkelige strømforbrug i watt, hvilket gør det muligt at beregne PUE i realtid.


Desuden kan vi udlede en gennemsnitlig PUE over en årlig periode, hvilket giver en mere omfattende vurdering i betragtning af sæsonudsving. Dette er særligt relevant i betragtning af forskellen i energiforbrug mellem årstider; for eksempel forskellen i kølebehov mellem sommer- og vintermåneder. Det betyder, at hvis vi vil have en mere pålidelig evaluering, er vi nødt til at prioritere et årsgennemsnit, der giver en mere afbalanceret og omfattende vurdering.


Det er også vigtigt at udforske PUE ikke kun i form af energi, men også monetære enheder, og derved inddrage de sæsonmæssige udsving i elpriserne. Evaluering af PUE i monetære termer giver et mere holistisk perspektiv på operationel effektivitet.


Desuden afslører denne tilgang muligheder for at opnå en PUE-værdi på mindre end 1 målt i dollars. Det bliver for eksempel muligt, når vi bruger spildvarme til vandopvarmning og sælger den videre til de nærliggende byer. Bemærkelsesværdige eksempler, såsom Googles datacenter i USA og Yandex' anlæg i Finland, viser levedygtigheden af en sådan praksis, især i regioner præget af høje energiomkostninger.


Effektivitet vs. pålidelighed

Bekymringer om at reducere omkostninger og øge effektiviteten rejser ofte spørgsmål om potentielle negative konsekvenser for pålideligheden. Jeg vil dog gerne understrege, at i frikøling går jagten på effektivitet ikke på kompromis med pålideligheden. I stedet kan dets teknologiske bivirkninger endda øge effektiviteten. For eksempel, som vi allerede har diskuteret, bliver omdirigering af overskudsvarme til varmepumper for yderligere fordele, såsom at generere varmt vand til nærliggende byer, en økonomisk fordelagtig praksis uden at ofre pålideligheden.



Fremtiden for gratis køling

På trods af alle de fordele, gratis køling tilbyder, er datacenterindustrien stadig drevet af en konservativ tilgang og kræver dokumenteret pålidelighed med en tendens til at modstå innovative løsninger. Afhængigheden af certificeringer fra organer som Uptime Institute for markedsføring udgør en anden hindring for frikølingsløsninger, der mangler en etableret certificering, hvilket får kommercielle udbydere til at se dem med skepsis.


Alligevel er der en tendens blandt virksomheders hyper-scalere til at anvende gratis køling som hovedløsningen til deres DC'er. Med et stigende antal virksomheder, der anerkender omkostningseffektiviteten og de operationelle fordele ved denne teknologi, forventer vi, at flere virksomhedsfrie køledatacentre vil dukke op i løbet af de næste 10-20 år.