paint-brush
Optimització de l'eficiència del centre de dades: una immersió profunda en les tècniques de refrigeració lliureper@egorkaritskii
99,982 lectures
99,982 lectures

Optimització de l'eficiència del centre de dades: una immersió profunda en les tècniques de refrigeració lliure

per Egor Karitskii10m2024/05/14
Read on Terminal Reader
Read this story w/o Javascript

Massa Llarg; Per llegir

Descobriu el potencial transformador de la tecnologia de refrigeració gratuïta als centres de dades, examinant els seus beneficis, reptes i impacte en l'eficiència i la fiabilitat. Exploreu com aquesta solució ecològica està revolucionant les estratègies de refrigeració i donant forma al futur de les operacions del centre de dades.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail

Coin Mentioned

Mention Thumbnail
featured image - Optimització de l'eficiència del centre de dades: una immersió profunda en les tècniques de refrigeració lliure
Egor Karitskii HackerNoon profile picture
0-item
1-item


A l' article anterior , vam comentar la ràpida expansió de la infraestructura del centre de dades i l'augment del consum d'electricitat que va provocar. A mesura que els servidors converteixen l'electricitat en calor durant el funcionament, la gestió de les altes temperatures i la refrigeració tant de les instal·lacions com dels equips del centre de dades es converteix en un problema número 1. per als equips de DC.


Tot i que els mètodes de refrigeració tradicionals, inclosos els aparells d'aire condicionat i els refrigeradors, refreden eficaçment les instal·lacions i els servidors del centre de dades, el seu cost continua sent un inconvenient important. La refrigeració lliure a diferència dels mètodes tradicionals no requereix inversions substancials però ofereix el mateix nivell d'eficiència i fiabilitat. En aquest article, faré una visió general detallada de la tecnologia de refrigeració gratuïta, destacant-ne els avantatges, les limitacions i els requisits per a una implementació satisfactòria.


Física del Free Cooling

Per entendre la física darrere del refredament lliure, haurem de revisar la fórmula de l'energia tèrmica:


Q = mcΔT


Aquí, "Q" representa la quantitat de calor guanyada o perduda, "m" representa la massa de la mostra (en el nostre cas, la massa d'aire al centre de dades), "c" denota la capacitat calorífica específica de l'aire, i ΔT significa el diferencial de temperatura.


En un centre de dades, la font de calor principal és la CPU. Normalment, hi ha de 2 a 4 CPU, cadascuna funcionant a uns 200 watts. Com s'ha comentat anteriorment, tota l'energia elèctrica consumida per les CPU es converteix en calor. Per tant, amb 2 CPU, per exemple, generem 400 watts de calor que cal dissipar. Ara el nostre objectiu és determinar la quantitat d'aire necessària per a aquest propòsit.


El paràmetre ΔT, o diferencial de temperatura, indica que com més baixa sigui la temperatura de l'aire exterior, menys massa d'aire es necessita per refredar les CPU. Per exemple, si la temperatura de l'aire d'entrada és de 0 °C i la temperatura de sortida és de 35 °C, ΔT només seria de 35, cosa que significa un requisit força més baix de massa d'aire. No obstant això, durant la temporada d'estiu, la refrigeració es fa més difícil a causa de l'augment de la temperatura ambient. Com més alta sigui la temperatura exterior, més gran serà la quantitat d'aire necessària per refredar els servidors.



Limitacions de temperatura dels components del servidor i de la xarxa

Tot i que la refrigeració lliure pot ser eficient per a climes moderats i freds, encara té limitacions a causa de les limitacions de temperatura dels components del servidor. Els components crítics dels equips informàtics i de xarxa, com ara processadors, RAM, discs durs, SSD i unitats NVMe, tenen requisits de temperatura operacionals:


  • Processadors: màxim 89°C
  • RAM: màxim 75 °C
  • Discs durs: màxim 50 °C
  • SSD i unitats NVMe: màxim 47-48 °C


Aquestes limitacions afecten directament la idoneïtat de les temperatures de l'aire exterior per a la refrigeració. La refrigeració lliure no seria viable a les regions on les temperatures exteriors superin aquests llindars o fins i tot s'acosten a ells, ja que podria danyar el sistema a causa del sobreescalfament. Limitacions regionals

Com ja hem explicat, les temperatures exteriors han de romandre constantment inferiors a les temperatures màximes de funcionament dels equips informàtics perquè el free cooling sigui efectiu. Això requereix una consideració acurada de les condicions climàtiques de la ubicació de DC. Les organitzacions han d'analitzar les previsions meteorològiques a llarg termini per garantir que les temperatures no superin els llindars requerits, fins i tot en dies o hores concrets. A més, tenint en compte la llarga vida útil dels centres de dades (normalment de 10 a 15 anys), els efectes de l'escalfament global també s'han de tenir en compte en les decisions d'ubicació.



Requisits d'arquitectura del node del servidor

En el context de la física, aconseguir una refrigeració eficient als servidors depèn de garantir un ampli flux d'aire a través del sistema. L'arquitectura del servidor juga un paper important en aquest procés.


Un exemple d'arquitectura de servidor amb forats de ventilació que faciliten el flux d'aire necessari i permeten un refredament lliure efectiu


Per contra, els servidors que no tenen característiques de disseny adequades, com ara perforacions o obertures, poden impedir el flux d'aire, cosa que podria comprometre l'eficiència global del mecanisme de refrigeració lliure.


Control d'humitat

El nivell d'humitat és una altra consideració crítica quan es tracta de refrigeració lliure. Com que no tenim control sobre les condicions d'humitat externa sorgeixen dues consultes pertinents: en primer lloc, abordar nivells d'humitat propers o superiors al 100% dins del centre de dades (DC); en segon lloc, abordar escenaris d'humitat de l'aire molt baixa, com durant un dia de febrer gelós amb una temperatura exterior de -30 °C i una humitat relativa que oscil·la entre el 2% i el 5%. Examinem sistemàticament aquestes situacions.


En condicions d'humitat elevada, hi ha una preocupació comuna pel que fa a la possible aparició de condensació i els seus efectes adversos sobre la funcionalitat de l'equip. Contràriament a aquesta preocupació, a les zones de refredament de la CC, on es produeix el procés de refrigeració, s'exclou la condensació. Això es deu al principi que la condensació transpira quan l'aire càlid i humit entra en contacte amb superfícies més fredes. Tanmateix, dins del sistema de refrigeració lliure del CC, cap element és més fred que l'aire circumdant. En conseqüència, la condensació s'impedeix inherentment, eliminant la necessitat de mesures proactives.


Al contrari, quan es tracta d'una humitat baixa, l'aprehensió es desplaça cap a la generació d'electricitat estàtica, que suposa una amenaça per a l'estabilitat de l'equip. Aquest problema no està associat a la condensació, però requereix una resolució diferent. La mitigació implica procediments de posada a terra i l'aplicació d'un revestiment de sòl especialitzat. Aquestes mesures s'alineen amb els mètodes establerts per protegir els equips interns contra l'electricitat estàtica. Mitjançant la posada a terra d'elements de construcció, bastidors i equips informàtics, una càrrega estàtica es dissipa a terra de manera inofensiva, preservant la integritat de l'equip.


En el clima natural, els casos d'humitat extremadament alta o baixa són poques vegades. Les excepcions notables inclouen esdeveniments rars com ara una tempesta que assoleix el 100% d'humitat al juliol o una gelada severa que provoca una humitat molt baixa. Tanmateix, durant la majoria de les vegades els nivells d'humitat es mantenen dins dels rangs acceptables que no suposen cap dany a l'equip, fins i tot en absència d'intervencions actives.


Quantitat i velocitat d'aire

Com ja hem comentat, per facilitar un refredament efectiu necessitem un volum substancial d'aire exterior. Simultàniament, sorgeix un requisit aparentment contraintuïtiu: mantenir un flux d'aire baix a l'edifici. Aquesta aparent paradoxa està arrelada en els reptes que plantegen els corrents d'aire d'alta velocitat que hi circulen.


Per simplificar, imagineu l'alta velocitat com un corrent robust d'un tub, creant remolins i turbulències al voltant de l'equip informàtic. Aquesta turbulència pot provocar moviments d'aire irregulars i sobreescalfament localitzat. Per fer-ho, apuntem estratègicament a una velocitat general baixa d'1-2 metres per segon a tot l'espai.


Mantenir aquesta velocitat controlada ens permet eliminar les turbulències. Una velocitat més alta comportaria el risc d'irregularitats en el moviment de l'aire. En adherir-se al rang d'1-2 metres per segon, afavorim un flux d'aire suau i uniforme, evitant el sobreescalfament localitzat. Aquest delicat equilibri garanteix una refrigeració òptima dels equips informàtics evitant els obstacles associats als corrents d'aire d'alta velocitat.


Com es pot veure, l'enfocament de refrigeració lliure gira al voltant de l'ús eficient de l'aire extern alhora que prioritza una baixa velocitat interior controlada. Aquesta estratègia deliberada ajuda a mantenir un flux d'aire laminar i uniforme, assegurant l'eficàcia de la refrigeració dels equips informàtics.


Concepte d'edifici

En el paradigma del free cooling, els conductes d'aire tradicionals no s'utilitzen dins de l'estructura de l'edifici. A diferència de les configuracions convencionals amb conductes d'aire designats a parets, sostres o àrees específiques, els centres de processament de dades adopten un enfocament no convencional. L'edifici en si està concebut com un conducte d'aire, deixant obsoletes les unitats de climatització tradicionals. La gran escala d'aquests conductes d'aire els transforma en components integrals d'habitacions i pisos.


Una representació esquemàtica del disseny de l'edifici de refrigeració lliure


El procés de flux d'aire s'inicia quan l'aire exterior entra a l'edifici, passant per dos tipus de filtres: filtres gruixuts i filtres fins. Una vegada que l'aire passa pel procés de neteja, és impulsat per ventiladors a volums expansius d'edifici, aproximadament equivalents a quatre plantes d'alçada. Aquest volum substancial té el seu propi propòsit: desaccelerar el flux d'aire, reduint la seva velocitat al rang necessari d'1-2 metres per segon. Posteriorment, l'aire baixa a la sala de màquines.


Després de travessar la sala de màquines, l'aire continua el seu viatge a través dels bastidors informàtics, avançant cap al passadís calent. Des d'allà, entra al col·lector d'aire calent abans de ser expulsat a l'exterior a través dels ventiladors d'extracció. Aquesta ruta de flux d'aire estructurada garanteix un procés de refrigeració eficient alhora que manté la velocitat de l'aire controlada.


Velocitat i volum

L'elecció deliberada del disseny d'utilitzar volums d'edifici expansius té un doble propòsit. En primer lloc, permet una reducció gradual de la velocitat de l'aire, assegurant que el flux d'aire aconsegueix la velocitat desitjada d'1-2 metres per segon. Aquesta velocitat controlada és essencial per evitar turbulències i mantenir un flux laminar, especialment important a mesura que l'aire avança a través d'equips informàtics sensibles. En segon lloc, el volum significatiu alberga el volum d'aire necessari per dissipar la calor generada de manera eficient. La interacció sincronitzada de la velocitat i el volum contribueix a l'èxit global del sistema.


La pressió diferencial com a únic impulsor de la gestió

En una configuració de refrigeració gratuïta, no tenim control sobre la temperatura de l'aire extern, cosa que provoca variacions en la temperatura de l'aire que entra al centre de dades (DC). Malgrat això, és essencial estimar el flux d'aire necessari per a la refrigeració de l'equip. Per solucionar-ho, ens basem en el mètode de pressió diferencial.


Dins de cada bastidor informàtic, els servidors amb ventiladors interns funcionen a diferents velocitats, creant conjuntament una pressió diferencial entre la part frontal i posterior del bastidor. Amb nombrosos servidors, cadascun contribuint al flux d'aire general, aquesta diferència de pressió s'acumula gradualment entre els passadissos freds i calents. Mitjançant sensors de pressió als dos passadissos i fora de l'edifici de CC, podem mesurar aquesta pressió diferencial.


El càlcul implica restar les dades del sensor de pressió al passadís calent de la pressió atmosfèrica i restar les dades del sensor de pressió al passadís fred de la pressió atmosfèrica. Així com a l'exemple següent:


Exemple del món real


Els valors resultants ens guien a l'hora de determinar el subministrament d'aire necessari al CC i l'escapament necessari per compensar el funcionament dels ventiladors del servidor. En termes més senzills, mesurem les nostres necessitats de flux d'aire en funció dels diferencials de pressió, cosa que ens permet gestionar el procés de refrigeració dins del DC de manera eficient.


Cambra de calefacció i mescla

Els sistemes de calefacció tradicionals no s'acostumen a implementar en Data Centers amb free cooling. L'ús d'aigua es considera irracional pel cost i els riscos potencials per a l'equip. Això suposa un repte durant els freds extrems, arribant a -20-30 graus a l'exterior. Tot i que l'equip ho gestiona bé, els enginyers busquen un enfocament més suau. La solució més elegant i lògica aquí és reutilitzar l'aire calent generat pels equips informàtics. Dirigint l'aire calent dels servidors a una cambra de mescla, i retornant part d'aquest al corrent d'aire principal, el sistema manté el local calent a l'hivern i permet estalviar costos en calefacció.


Simplicitat i fiabilitat

Una tesi clau en la teoria de la fiabilitat afirma que la simplicitat engendra fiabilitat. Això és vàlid per al sistema de refrigeració lliure que es presenta com un concepte molt senzill. El sistema funciona com una barricada, introduint l'aire de l'exterior a través dels filtres, passant-lo a través d'equips informàtics i després simplement expulsant-lo.


L'absència de sistemes complexos millora la fiabilitat, ja que només els ventiladors representen una vulnerabilitat quan fa calor. L'enfocament de refrigeració lliure exemplifica la simplificació radical del sistema, millorant substancialment la fiabilitat reduint el nombre d'elements.


Ventiladors DC vs ventiladors de servidor

L'autoritat jeràrquica dels ventiladors és una altra qüestió fonamental en la dinàmica del flux d'aire dins dels DC. Com hem comentat, hi ha ventiladors a gran escala a nivell de corrent continu i a nivell de servidor. La pregunta és: els ventiladors del centre de dades només subministren aire, deixant que els ventiladors del servidor consumeixin tant com sigui necessari? O la demanda prové dels ventiladors del servidor, que obliga els fans de DC a complir els seus requisits?


El mecanisme és el següent: els ventiladors del servidor tenen un paper dominant en aquest procés, determinant el flux d'aire necessari. Posteriorment, els ventiladors de CC responen lliurant el volum d'aire necessari. Es fa evident que si la demanda acumulada de tots els servidors supera la capacitat de subministrament del ventilador de CC, pot provocar un possible sobreescalfament.

Per tant, la resposta és que els aficionats al servidor tenen la primacia en aquesta dinàmica. Organitzen el flux d'aire, especificant la quantitat d'aire necessària.


Càlcul d'eficiència i PUE

Per avaluar l'eficiència d'un projecte de corrent continu, s'utilitza tradicionalment el càlcul de l'efectivitat de l'ús d'energia (PUE). La fórmula del PUE és la relació entre la potència total de la instal·lació i la potència de l'equip informàtic:


PUE = Potència total de la instal·lació / Potència de l'equip informàtic


Idealment, és igual a 1, la qual cosa significa que tota l'energia es dirigeix als equips informàtics sense cap malbaratament. Tanmateix, assolir aquest escenari perfecte és poc freqüent en projectes del món real.


Un altre problema sorgeix quan intentem establir una metodologia clara per calcular l'efectivitat de l'ús de l'energia (PUE). Així, per exemple, al nostre sistema, disposem d'una mètrica que indica el consum instantani d'energia en watts, que permet calcular el PUE en temps real.


A més, podem obtenir un PUE mitjà durant un període anual, que ofereix una avaluació més completa tenint en compte les fluctuacions estacionals. Això és especialment rellevant donada la disparitat en l'ús d'energia entre estacions; per exemple, la disparitat en els requisits de refrigeració entre els mesos d'estiu i d'hivern. Això vol dir que si volem tenir una avaluació més fiable, hem de prioritzar una mitjana anual que proporcioni una avaluació més equilibrada i integral.


També és important explorar el PUE no només en termes d'energia sinó també en unitats monetàries, incorporant així les fluctuacions estacionals dels preus de l'electricitat. L'avaluació del PUE en termes monetaris ofereix una perspectiva més holística de l'eficiència operativa.


A més, aquest enfocament revela possibilitats per aconseguir un valor PUE inferior a 1 quan es mesura en dòlars. És possible, per exemple, quan utilitzem la calor residual per escalfar l'aigua i la venem més endavant a les ciutats properes. Exemples destacables, com ara el centre de dades de Google als EUA i les instal·lacions de Yandex a Finlàndia, demostren la viabilitat d'aquestes pràctiques, especialment a les regions caracteritzades per uns costos energètics elevats.


Eficiència vs. Fiabilitat

Les preocupacions sobre la reducció de costos i l'augment de l'eficiència solen plantejar preguntes sobre possibles impactes negatius en la fiabilitat. Tanmateix, m'agradaria subratllar que en la refrigeració lliure la recerca de l'eficiència no compromet la fiabilitat. En canvi, els seus efectes secundaris tecnològics poden fins i tot millorar l'eficiència. Per exemple, com ja hem comentat, redirigir l'excés de calor a bombes de calor per obtenir beneficis addicionals, com ara generar aigua calenta per a ciutats properes, esdevé una pràctica econòmicament avantatjosa sense sacrificar la fiabilitat.



Futur del Free Cooling

Malgrat tots els avantatges que ofereix el free cooling, la indústria dels centres de dades segueix impulsada per un enfocament conservador i exigeix una fiabilitat provada, amb una tendència a resistir solucions innovadores. La confiança en certificacions d'organismes com el Uptime Institute per al màrqueting suposa un altre obstacle per a les solucions de refrigeració gratuïta, que no tenen una certificació establerta, el que porta els proveïdors comercials a veure-les amb escepticisme.


No obstant això, hi ha una tendència entre els hiperescaladors corporatius d'adoptar la refrigeració lliure com a solució principal per als seus DC. Amb un nombre creixent d'empreses que reconeixen la rendibilitat i els beneficis operatius d'aquesta tecnologia, esperem que en els propers 10-20 anys apareguin més centres de dades de refrigeració sense corporacions.