paint-brush
Optimización da eficiencia do centro de datos: un mergullo profundo nas técnicas de freecoolingpor@egorkaritskii
99,982 lecturas
99,982 lecturas

Optimización da eficiencia do centro de datos: un mergullo profundo nas técnicas de freecooling

por Egor Karitskii10m2024/05/14
Read on Terminal Reader
Read this story w/o Javascript

Demasiado longo; Ler

Descubra o potencial transformador da tecnoloxía de free cooling nos centros de datos, examinando os seus beneficios, retos e impacto na eficiencia e fiabilidade. Explora como esta solución ecolóxica está a revolucionar as estratexias de refrixeración e a dar forma ao futuro das operacións do centro de datos.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail

Coin Mentioned

Mention Thumbnail
featured image - Optimización da eficiencia do centro de datos: un mergullo profundo nas técnicas de freecooling
Egor Karitskii HackerNoon profile picture
0-item
1-item


No artigo anterior , discutimos a rápida expansión da infraestrutura do centro de datos e o aumento do consumo de electricidade que provocou. Como os servidores converten a electricidade en calor durante o funcionamento, a xestión de altas temperaturas e o arrefriamento tanto das instalacións como dos equipos do centro de datos convértese nun problema número 1. para os equipos de DC.


Aínda que os métodos de refrixeración tradicionais, incluídos os aire acondicionado e os refrixeradores, arrefrían eficazmente as instalacións e os servidores dos centros de datos, o seu custo segue sendo un inconveniente importante. O free cooling, en contraste cos métodos tradicionais, non esixe investimentos substanciais pero ofrece o mesmo nivel de eficiencia e fiabilidade. Neste artigo, farei unha visión xeral detallada da tecnoloxía de refrixeración gratuíta, destacando os seus beneficios, limitacións e requisitos para unha implementación exitosa.


Física do Free Cooling

Para comprender a física detrás do free cooling, necesitaremos revisar a fórmula da enerxía térmica:


Q = mcΔT


Aquí, "Q" representa a cantidade de calor gañada ou perdida, "m" representa a masa da mostra (no noso caso, a masa de aire no centro de datos), "c" denota a capacidade calorífica específica do aire, e ΔT significa o diferencial de temperatura.


Nun centro de datos, a fonte de calor principal é a CPU. Normalmente, hai de 2 a 4 CPU, cada unha funcionando a uns 200 watts. Como comentamos anteriormente, toda a enerxía eléctrica consumida polas CPU convértese en calor. Polo tanto, con 2 CPU, por exemplo, xeramos 400 vatios de calor que hai que disipar. Agora o noso obxectivo é determinar a cantidade de aire necesaria para este fin.


O parámetro ΔT, ou diferencial de temperatura, indica que canto menor sexa a temperatura do aire exterior, menos masa de aire se necesita para arrefriar as CPU. Por exemplo, se a temperatura do aire de entrada é de 0 °C e a de saída é de 35 °C, ΔT sería só 35, o que significa un requisito bastante inferior para a masa de aire. Non obstante, durante a estación estival, o arrefriamento faise máis difícil debido ao aumento da temperatura ambiente. Canto maior sexa a temperatura exterior, maior será a cantidade de aire necesario para arrefriar os servidores.



Limitacións de temperatura dos compoñentes do servidor e da rede

Aínda que o free cooling pode ser eficiente para climas moderados e fríos, aínda ten limitacións debido ás restricións de temperatura nos compoñentes do servidor. Os compoñentes críticos dos equipos informáticos e de rede, como procesadores, memoria RAM, discos duros, unidades SSD e unidades NVMe, teñen requisitos de temperatura de funcionamento:


  • Procesadores: máximo 89°C
  • RAM: máx. 75 °C
  • Discos duros: máx. 50 °C
  • SSD e unidades NVMe: máx. 47-48 °C


Estas limitacións afectan directamente a idoneidade das temperaturas do aire exterior para o arrefriamento. O free cooling non sería viable en rexións onde as temperaturas exteriores superen estes limiares ou mesmo se acheguen a eles, xa que podería danar o sistema debido ao sobrequecemento. Limitacións rexionais

Como xa explicamos, as temperaturas exteriores deben permanecer constantemente inferiores ás temperaturas máximas de funcionamento dos equipos informáticos para que o free cooling sexa efectivo. Isto require unha consideración coidadosa das condicións climáticas do lugar de DC. As organizacións deben analizar as previsións meteorolóxicas a longo prazo para garantir que as temperaturas non superen os limiares esixidos, mesmo en días ou horas concretos. Ademais, tendo en conta a longa vida útil dos centros de datos (normalmente de 10 a 15 anos), os efectos do quentamento global tamén se deben ter en conta nas decisións de localización.



Requisitos de arquitectura do nodo do servidor

No contexto da física, conseguir un arrefriamento eficiente nos servidores depende de garantir un amplo fluxo de aire a través do sistema. A arquitectura do servidor xoga un papel importante neste proceso.


Un exemplo de arquitectura de servidor con orificios de ventilación que facilitan o fluxo de aire necesario e permiten un arrefriamento libre efectivo


Pola contra, os servidores que carecen de funcións de deseño adecuadas, como perforacións ou aberturas, poden impedir o fluxo de aire, comprometendo potencialmente a eficiencia global do mecanismo de refrixeración libre.


Control de humidade

O nivel de humidade é outra consideración crítica cando se trata de free cooling. Como carecemos de control sobre as condicións de humidade externa xorden dúas preguntas pertinentes: en primeiro lugar, abordar niveis de humidade próximos ou superiores ao 100% dentro do centro de datos (DC); en segundo lugar, abordando escenarios de humidade do aire moi baixa, como durante un día xeado de febreiro cunha temperatura exterior de -30 °C e unha humidade relativa que oscila entre o 2% e o 5%. Examinemos sistemáticamente estas situacións.


En condicións de humidade elevada, existe unha preocupación común sobre a posible aparición de condensación e os seus efectos adversos sobre a funcionalidade dos equipos. Contrariamente a esta preocupación, dentro das zonas de refrixeración do DC, onde se produce o proceso de arrefriamento, prohíbese a condensación. Isto débese ao principio de que a condensación se produce cando o aire quente e húmido entra en contacto con superficies máis frías. Non obstante, dentro do sistema de free cooling do DC, ningún elemento é máis frío que o aire circundante. En consecuencia, a condensación é inherentemente impedida, eliminando a necesidade de medidas proactivas.


Pola contra, cando se trata de baixa humidade, a aprehensión desprázase cara á xeración de electricidade estática, que supón unha ameaza para a estabilidade dos equipos. Este problema non está asociado á condensación, pero require unha resolución distintiva. A mitigación implica procedementos de posta a terra e a aplicación dun revestimento de chan especializado. Estas medidas axústanse aos métodos establecidos para protexer os equipos internos contra a electricidade estática. Ao poñer a terra elementos de construción, bastidores e equipos informáticos, unha carga estática disípase de forma inofensiva ao chan, preservando a integridade do equipo.


No clima natural, casos de humidade extremadamente alta ou baixa son raramente. As excepcións notables inclúen eventos raros como unha treboada que alcanza o 100% de humidade en xullo ou unha xeada severa que provoca unha humidade moi baixa. Non obstante, na maioría das veces, os niveis de humidade permanecen dentro de rangos aceptables que non supoñen ningún dano para o equipo, mesmo en ausencia de intervencións activas.


Cantidade e velocidade de aire

Como xa comentamos, para facilitar un arrefriamento eficaz necesitamos un volume substancial de aire externo. Simultaneamente, xorde un requisito aparentemente contraintuitivo: manter un fluxo de aire baixo dentro do edificio. Este aparente paradoxo radica nos desafíos que presentan as correntes de aire de alta velocidade que circulan por dentro.


Para simplificar, imaxina a alta velocidade como un fluxo robusto dun tubo, que crea remolinos e turbulencias ao redor do equipo informático. Esta turbulencia pode provocar movementos irregulares de aire e sobrequecemento localizado. Para solucionar isto, pretendemos estratexicamente unha baixa velocidade global de 1-2 metros por segundo en todo o espazo.


Manter esta velocidade controlada permítenos eliminar as turbulencias. Unha velocidade maior arriscaría a irregularidades no movemento do aire. Ao adherirse ao rango de 1-2 metros por segundo, favorecemos un fluxo de aire suave e uniforme, evitando o sobreenriquecemento localizado. Este delicado equilibrio garante un arrefriamento óptimo dos equipos informáticos evitando as trampas asociadas ás correntes de aire de alta velocidade.


Como se pode ver, o enfoque de free cooling xira en torno ao uso eficiente do aire externo ao tempo que prioriza unha baixa velocidade do aire interior controlada. Esta estratexia deliberada axuda a manter un fluxo de aire laminar e uniforme, garantindo a eficacia da refrixeración dos equipos informáticos.


Concepto de edificio

No paradigma do free cooling, os condutos de aire tradicionais non se empregan dentro da estrutura do edificio. A diferenza das instalacións convencionais con condutos de aire designados en paredes, teitos ou áreas específicas, os centros de procesamento de datos adoptan un enfoque non convencional. O propio edificio está concibido como un conducto de aire, o que deixa obsoletos os equipos de climatización tradicionais. A gran escala destes condutos de aire transfórmaos en compoñentes integrantes de cuartos e pisos.


Unha representación esquemática do deseño do edificio de free-cooling


O proceso de fluxo de aire comeza cando o aire externo entra no edificio, pasando por dous tipos de filtros: filtros gruesos e filtros finos. Unha vez que o aire se somete ao proceso de limpeza, é impulsado por ventiladores a grandes volumes de edificios, aproximadamente equivalentes a catro plantas de altura. Este volume substancial cumpre o seu propio propósito: desacelerar o fluxo de aire, reducindo a súa velocidade ao intervalo necesario de 1-2 metros por segundo. Posteriormente, o aire descende á sala de máquinas.


Despois de atravesar a sala de máquinas, o aire continúa a súa viaxe a través dos bastidores informáticos, progresando cara ao corredor quente. Desde alí, entra no colector de aire quente antes de ser expulsado ao exterior a través dos ventiladores de extracción. Este camiño de fluxo de aire estruturado garante un proceso de arrefriamento eficiente mantendo a velocidade do aire controlada.


Velocidade e volume

A elección deliberada do deseño de usar volumes de edificio expansivos ten un dobre propósito. En primeiro lugar, permite unha redución gradual da velocidade do aire, garantindo que o fluxo de aire alcance a velocidade desexada de 1-2 metros por segundo. Esta velocidade controlada é esencial para evitar turbulencias e manter un fluxo laminar, especialmente importante a medida que o aire avanza a través de equipos informáticos sensibles. En segundo lugar, o volume significativo acomoda o volume de aire necesario para disipar a calor xerada de forma eficiente. A interacción sincronizada da velocidade e do volume contribúe ao éxito global do sistema.


Presión diferencial como único impulsor da xestión

Nunha configuración de refrixeración gratuíta, non temos control sobre a temperatura do aire externo, o que provoca variacións na temperatura do aire que entra no Data Center (DC). A pesar diso, é esencial estimar o fluxo de aire necesario para o arrefriamento dos equipos. Para solucionar isto, confiamos no método da presión diferencial.


Dentro de cada rack de TI, os servidores con ventiladores internos funcionan a diferentes velocidades, creando colectivamente unha presión diferencial entre a parte frontal e posterior do rack. Con numerosos servidores, cada un contribúe ao fluxo de aire global, esta diferenza de presión vaise acumulando gradualmente entre os corredores fríos e quentes. Usando sensores de presión en ambos corredores e fóra do edificio de CC, podemos medir esta presión diferencial.


O cálculo implica restar os datos do sensor de presión no corredor quente da presión atmosférica e restar os datos do sensor de presión no corredor frío da presión atmosférica. Así como no seguinte exemplo:


Exemplo do mundo real


Os valores resultantes guiános para determinar a subministración de aire necesaria ao DC e o escape necesario para compensar o funcionamento dos ventiladores do servidor. En termos máis sinxelos, medimos as nosas necesidades de fluxo de aire en función dos diferenciais de presión, o que nos permite xestionar o proceso de arrefriamento dentro do DC de forma eficiente.


Cámara de calefacción e mestura

Os sistemas de calefacción tradicionais non adoitan implantarse nos Data Centers con free cooling. O uso da auga considérase irracional debido ao custo e aos riscos potenciais para os equipos. Isto supón un desafío durante os fríos extremos, chegando a -20-30 graos fóra. Aínda que o equipo manexa ben, os enxeñeiros buscan un enfoque máis suave. A solución máis elegante e lóxica aquí é a reutilización do aire quente xerado polos equipos informáticos. Dirixindo o aire quente dos servidores a unha cámara de mestura, e devolvendo parte del á corrente de aire principal, o sistema mantén o local quente no inverno e permite aforrar custos de calefacción.


Sinxeleza e fiabilidade

Unha tese clave na teoría da fiabilidade afirma que a sinxeleza xera fiabilidade. Isto vale para o sistema de refrixeración gratuíta que se presenta como un concepto moi sinxelo. O sistema funciona como unha barricada, introducindo aire do exterior a través de filtros, pasándoo a través de equipos informáticos e, a continuación, simplemente expulsándoo.


A ausencia de sistemas complexos mellora a fiabilidade, xa que só os fans presentan unha vulnerabilidade en tempo quente. O enfoque de free-cooling exemplifica a simplificación radical do sistema, mellorando substancialmente a fiabilidade ao reducir o número de elementos.


Ventiladores DC vs Ventiladores do servidor

A autoridade xerárquica dos fans é outra cuestión fundamental na dinámica do fluxo de aire dentro dos DC. Como comentamos, hai fanáticos a gran escala a nivel de DC e outros a nivel de servidor. A pregunta é: os ventiladores do centro de datos só fornecen aire, deixando que os ventiladores do servidor consuman tanto como sexa necesario? Ou a demanda procede dos fanáticos do servidor, o que obriga aos fanáticos de DC a cumprir os seus requisitos?


O mecanismo é o seguinte: os ventiladores do servidor teñen un papel dominante neste proceso, determinando o fluxo de aire necesario. Posteriormente, os ventiladores de CC responden entregando o volume de aire necesario. Faise evidente que se a demanda acumulada de todos os servidores supera a capacidade de subministración do ventilador de CC, pode provocar un posible sobrequecemento.

Entón, a resposta é que os fanáticos dos servidores teñen a primacía nesta dinámica. Eles orquestran o fluxo de aire, especificando a cantidade de aire necesaria.


Cálculo de eficiencia e PUE

Para avaliar a eficiencia dun proxecto de CC, utilízase tradicionalmente o cálculo da Eficacia de Uso de Energía (PUE). A fórmula para o PUE é a relación entre a potencia total da instalación e a potencia do equipo de TI:


PUE = Potencia total da instalación / Potencia do equipo de TI


Idealmente, é igual a 1, o que significa que toda a enerxía se dirixe aos equipos informáticos sen desperdicio. Non obstante, conseguir este escenario perfecto é raro nos proxectos do mundo real.


Outro problema xorde cando tentamos establecer unha metodoloxía clara para calcular a Eficacia do Uso da Energía (PUE). Así, por exemplo, no noso sistema, posuímos unha métrica que indica o consumo instantáneo de enerxía en vatios, o que permite calcular o PUE en tempo real.


Ademais, podemos derivar un PUE medio nun período anual, o que ofrece unha avaliación máis completa tendo en conta as flutuacións estacionais. Isto é especialmente pertinente dada a disparidade no uso de enerxía entre estacións; por exemplo, a disparidade nos requisitos de refrixeración entre os meses de verán e inverno. Isto significa que se queremos ter unha avaliación máis fiable, cómpre priorizar unha media anual que proporcione unha avaliación máis equilibrada e completa.


Tamén é importante explorar o PUE non só en termos de enerxía senón tamén de unidades monetarias, incorporando así as flutuacións estacionais dos prezos da electricidade. Avaliar o PUE en termos monetarios dá unha perspectiva máis holística sobre a eficiencia operativa.


Ademais, este enfoque revela posibilidades para acadar un valor PUE inferior a 1 cando se mide en dólares. Faise posible, por exemplo, cando usamos a calor residual para quentar auga e vendémola máis adiante ás cidades próximas. Exemplos notables, como o centro de datos de Google en Estados Unidos e as instalacións de Yandex en Finlandia, demostran a viabilidade destas prácticas, especialmente en rexións caracterizadas por altos custos enerxéticos.


Eficiencia vs Fiabilidade

As preocupacións sobre a redución de custos e o aumento da eficiencia adoitan xerar preguntas sobre os posibles impactos negativos na fiabilidade. Non obstante, gustaríame subliñar que no free cooling a procura da eficiencia non compromete a fiabilidade. Pola contra, os seus efectos secundarios tecnolóxicos poden incluso mellorar a eficiencia. Por exemplo, como xa comentamos, redirixir o exceso de calor ás bombas de calor para obter beneficios adicionais, como xerar auga quente para as cidades próximas, convértese nunha práctica financeira vantaxosa sen sacrificar a fiabilidade.



Futuro do Free Cooling

A pesar de todas as vantaxes que ofrece o free cooling, a industria dos centros de datos segue impulsada por un enfoque conservador e esixe unha fiabilidade comprobada, cunha tendencia a resistir solucións innovadoras. A dependencia de certificacións de organismos como o Instituto Uptime para o marketing supón outro obstáculo para as solucións de free cooling, carecendo dunha certificación establecida, o que leva aos provedores comerciais a velos con escepticismo.


Non obstante, hai unha tendencia entre os hiperescaladores corporativos a adoptar o free cooling como solución principal para os seus DC. Con un número crecente de empresas que recoñecen a rendibilidade e os beneficios operativos desta tecnoloxía, esperamos que nos próximos 10-20 anos aparezan máis centros de datos de refrixeración sen corporativos.