في المقالة السابقة ، ناقشنا التوسع السريع في البنية التحتية لمركز البيانات وزيادة استهلاك الكهرباء التي نتجت عنه. ومع قيام الخوادم بتحويل الكهرباء إلى حرارة أثناء التشغيل، تصبح إدارة درجات الحرارة المرتفعة وتبريد مرافق ومعدات مركز البيانات مشكلة رقم 1 بالنسبة لفرق مركز البيانات.
في حين أن طرق التبريد التقليدية، بما في ذلك مكيفات الهواء والمبردات، تعمل على تبريد مراكز البيانات والخوادم بفعالية، إلا أن تكلفتها العالية تظل عيبًا كبيرًا. على عكس الطرق التقليدية، لا يتطلب التبريد المجاني استثمارات كبيرة ولكنه يوفر نفس مستوى الكفاءة والموثوقية. في هذه المقالة، سأقدم نظرة عامة مفصلة على تقنية التبريد المجاني، مع تسليط الضوء على فوائدها وقيودها ومتطلبات التنفيذ الناجح.
لفهم الفيزياء وراء التبريد الحر، سنحتاج إلى إعادة النظر في صيغة طاقة الحرارة:
س = مكΔT
هنا، يمثل "Q" كمية الحرارة المكتسبة أو المفقودة، ويمثل "m" كتلة العينة (في حالتنا، كتلة الهواء في مركز البيانات)، ويمثل "c" السعة الحرارية النوعية للهواء، ويمثل ΔT الفرق في درجة الحرارة.
في مركز البيانات، يكون مصدر الحرارة الأساسي هو وحدة المعالجة المركزية. وعادةً ما يكون هناك من 2 إلى 4 وحدات معالجة مركزية، تعمل كل منها بقدرة 200 وات تقريبًا. وكما ناقشنا سابقًا، يتم تحويل كل الطاقة الكهربائية التي تستهلكها وحدات المعالجة المركزية إلى حرارة. لذلك، مع وجود وحدتي معالجة مركزية، على سبيل المثال، نولد 400 وات من الحرارة التي يتعين تبديدها. والآن هدفنا هو تحديد كمية الهواء المطلوبة لهذا الغرض.
يشير المعامل ΔT، أو الفارق في درجة الحرارة، إلى أنه كلما انخفضت درجة حرارة الهواء الخارجي، كلما قلت الحاجة إلى كتلة هواء لتبريد وحدات المعالجة المركزية. على سبيل المثال، إذا كانت درجة حرارة الهواء الداخل 0 درجة مئوية ودرجة حرارة الهواء الخارج 35 درجة مئوية، فإن ΔT ستكون 35 فقط، مما يدل على انخفاض الحاجة إلى كتلة الهواء. ومع ذلك، خلال موسم الصيف، يصبح التبريد أكثر صعوبة بسبب ارتفاع درجات الحرارة المحيطة. وكلما ارتفعت درجة الحرارة الخارجية، زادت كمية الهواء المطلوبة لتبريد الخوادم.
على الرغم من أن التبريد المجاني قد يكون فعالاً في المناخات المعتدلة والباردة، إلا أنه لا يزال يواجه قيودًا بسبب قيود درجة الحرارة على مكونات الخادم. تتطلب المكونات الحيوية في معدات تكنولوجيا المعلومات والشبكات، مثل المعالجات وذاكرة الوصول العشوائي ومحركات الأقراص الصلبة ومحركات أقراص الحالة الصلبة ومحركات NVMe، متطلبات درجة حرارة تشغيلية:
تؤثر هذه القيود بشكل مباشر على ملاءمة درجات حرارة الهواء الخارجي للتبريد. لن يكون التبريد المجاني قابلاً للتطبيق في المناطق التي تتجاوز فيها درجات الحرارة الخارجية هذه الحدود أو حتى تقترب منها، حيث قد يؤدي ذلك إلى إتلاف النظام بسبب ارتفاع درجة الحرارة. القيود الإقليمية
كما أوضحنا بالفعل، يجب أن تظل درجات الحرارة الخارجية أقل باستمرار من درجات الحرارة التشغيلية القصوى لمعدات تكنولوجيا المعلومات حتى يكون التبريد المجاني فعالاً. وهذا يستلزم دراسة متأنية لظروف المناخ في موقع مركز البيانات. يجب على المنظمات تحليل توقعات الطقس طويلة الأجل لضمان عدم تجاوز درجات الحرارة للحدود المطلوبة، حتى في أيام أو ساعات محددة. بالإضافة إلى ذلك، نظرًا لطول عمر مراكز البيانات (عادةً من 10 إلى 15 عامًا)، فيجب أيضًا وضع تأثيرات الانحباس الحراري العالمي في الاعتبار عند اتخاذ قرارات تحديد الموقع.
في سياق الفيزياء، يعتمد تحقيق التبريد الفعّال في الخوادم على ضمان تدفق الهواء بكميات كبيرة عبر النظام. وتلعب بنية الخادم دورًا مهمًا في هذه العملية.
وعلى العكس من ذلك، فإن الخوادم التي تفتقر إلى ميزات التصميم المناسبة، مثل الثقوب أو الفتحات، قد تعيق تدفق الهواء، مما قد يعرض الكفاءة الإجمالية لآلية التبريد المجاني للخطر.
يعد مستوى الرطوبة من الاعتبارات الحاسمة الأخرى عندما يتعلق الأمر بالتبريد المجاني. نظرًا لافتقارنا إلى التحكم في ظروف الرطوبة الخارجية، ينشأ استفساران وثيقا الصلة: أولاً، معالجة مستويات الرطوبة التي تقترب من 100% أو تتجاوزها داخل مركز البيانات (DC)؛ ثانيًا، معالجة سيناريوهات الرطوبة الجوية المنخفضة للغاية، مثل يوم فبراير البارد مع درجة حرارة خارجية تبلغ -30 درجة مئوية ورطوبة نسبية تتراوح من 2% إلى 5%. دعونا نفحص هذه المواقف بشكل منهجي.
في ظل ظروف الرطوبة المرتفعة، هناك مخاوف شائعة بشأن احتمال حدوث التكثيف وتأثيراته السلبية على وظائف المعدات. وعلى النقيض من هذا القلق، فإن التكثيف مستبعد داخل مناطق إعادة التبريد في مركز البيانات، حيث تحدث عملية التبريد. ويرجع هذا إلى المبدأ القائل بأن التكثيف يحدث عندما يتلامس الهواء الدافئ الرطب مع الأسطح الأكثر برودة. ومع ذلك، داخل نظام التبريد الحر لمركز البيانات، لا يوجد عنصر أبرد من الهواء المحيط. وبالتالي، يتم إعاقة التكثيف بطبيعته، مما يلغي الحاجة إلى تدابير استباقية.
وعلى العكس من ذلك، عند التعامل مع انخفاض الرطوبة، يتحول القلق نحو توليد الكهرباء الساكنة، مما يشكل تهديدًا لاستقرار المعدات. لا ترتبط هذه المشكلة بالتكثيف ولكنها تتطلب حلًا مميزًا. يتضمن التخفيف إجراءات التأريض وتطبيق طلاء أرضي متخصص. تتوافق هذه التدابير مع الأساليب المعمول بها لحماية المعدات الداخلية من الكهرباء الساكنة. من خلال تأريض عناصر البناء والأرفف ومعدات تكنولوجيا المعلومات، يتم تبديد الشحنة الساكنة بشكل غير ضار على الأرض، مما يحافظ على سلامة المعدات.
في المناخ الطبيعي، نادرًا ما تحدث حالات ارتفاع أو انخفاض شديد للرطوبة. تشمل الاستثناءات الجديرة بالملاحظة أحداثًا نادرة مثل عاصفة رعدية تصل فيها الرطوبة إلى 100% في يوليو أو صقيع شديد يتسبب في انخفاض الرطوبة بشكل كبير. ومع ذلك، تظل مستويات الرطوبة في أغلب الأحيان ضمن النطاقات المقبولة التي لا تسبب أي ضرر للمعدات، حتى في غياب التدخلات النشطة.
وكما ناقشنا بالفعل، فمن أجل تيسير التبريد الفعال، نحتاج إلى حجم كبير من الهواء الخارجي. وفي الوقت نفسه، ينشأ متطلب يبدو غير بديهي ــ الحفاظ على تدفق هواء منخفض داخل المبنى. وتتجذر هذه المفارقة الواضحة في التحديات التي تفرضها التيارات الهوائية عالية السرعة التي تدور داخل المبنى.
لتبسيط الأمر، تخيل سرعة الهواء العالية كتيار قوي من الأنبوب، مما يخلق دوامات واضطرابات حول معدات تكنولوجيا المعلومات. قد يؤدي هذا الاضطراب إلى تحركات هواء غير منتظمة وارتفاع درجة الحرارة المحلية. لمعالجة هذا، نهدف استراتيجيًا إلى سرعة هواء منخفضة إجمالية تتراوح من متر إلى مترين في الثانية في جميع أنحاء المساحة.
إن الحفاظ على سرعة الهواء هذه يسمح لنا بالتخلص من الاضطرابات. فالسرعة الأعلى قد تؤدي إلى حدوث مخالفات في حركة الهواء. ومن خلال الالتزام بنطاق 1-2 متر في الثانية، فإننا نعزز تدفق الهواء السلس والموحد، ونتجنب ارتفاع درجة الحرارة الموضعية. ويضمن هذا التوازن الدقيق تبريدًا مثاليًا لمعدات تكنولوجيا المعلومات من خلال تجنب المزالق المرتبطة بتيارات الهواء عالية السرعة.
كما يمكن ملاحظة ذلك، فإن نهج التبريد المجاني يدور حول الاستخدام الفعّال للهواء الخارجي مع إعطاء الأولوية لسرعة هواء داخلية منخفضة ومحكومة. تساعد هذه الاستراتيجية المتعمدة في الحفاظ على تدفق هواء صفائحي وموحد، مما يضمن فعالية تبريد معدات تكنولوجيا المعلومات.
في نموذج التبريد المجاني، لا يتم استخدام مجاري الهواء التقليدية داخل هيكل المبنى. وعلى عكس الإعدادات التقليدية التي تحتوي على مجاري هواء مخصصة في الجدران أو الأسقف أو مناطق محددة، تتبنى مراكز معالجة البيانات نهجًا غير تقليدي. فالمبنى نفسه مصمم كقناة هواء، مما يجعل وحدات تكييف الهواء التقليدية عتيقة. والحجم الهائل لهذه المجاري الهوائية يحولها إلى مكونات متكاملة للغرف والأرضيات.
تبدأ عملية تدفق الهواء عندما يدخل الهواء الخارجي إلى المبنى، ويمر عبر نوعين من المرشحات - المرشحات الخشنة والمرشحات الدقيقة. وبمجرد خضوع الهواء لعملية التنظيف، يتم دفعه بواسطة المراوح إلى أحجام كبيرة من المبنى، تعادل ارتفاع أربعة طوابق تقريبًا. يخدم هذا الحجم الكبير غرضه الخاص: إبطاء تدفق الهواء، وتقليل سرعته إلى النطاق المطلوب من 1 إلى 2 متر في الثانية. بعد ذلك، ينزل الهواء إلى غرفة الآلات.
بعد عبور غرفة الآلات، يستمر الهواء في رحلته عبر رفوف تكنولوجيا المعلومات، ويتقدم إلى الممر الساخن. ومن هناك، يدخل إلى مجمع الهواء الساخن قبل طرده خارجًا من خلال مراوح العادم. يضمن مسار تدفق الهواء المنظم هذا عملية تبريد فعالة مع الحفاظ على سرعة الهواء المتحكم فيها.
إن الاختيار المتعمد لتصميم المباني ذات الأحجام الكبيرة يخدم غرضين. أولاً وقبل كل شيء، يسمح بخفض تدريجي لسرعة الهواء، مما يضمن أن يصل تدفق الهواء إلى السرعة المطلوبة التي تتراوح بين متر إلى مترين في الثانية. تعد سرعة الهواء المتحكم فيها ضرورية لمنع الاضطرابات والحفاظ على تدفق الهواء الرقائقي، وهو أمر مهم بشكل خاص مع تقدم الهواء عبر معدات تكنولوجيا المعلومات الحساسة. ثانياً، يستوعب الحجم الكبير حجم الهواء اللازم لتبديد الحرارة المتولدة بكفاءة. يساهم التفاعل المتزامن بين سرعة الهواء والحجم في النجاح العام للنظام.
في إعدادات التبريد المجانية، لا نتحكم في درجة حرارة الهواء الخارجي، مما يؤدي إلى اختلافات في درجة حرارة الهواء الداخل إلى مركز البيانات (DC). وعلى الرغم من ذلك، فإن تقدير تدفق الهواء المطلوب لتبريد المعدات أمر ضروري. ولمعالجة هذه المشكلة، نعتمد على طريقة الضغط التفاضلي.
داخل كل رف من رفوف تكنولوجيا المعلومات، تعمل الخوادم ذات المراوح الداخلية بسرعات مختلفة، مما يؤدي بشكل جماعي إلى خلق ضغط تفاضلي بين مقدمة وخلفية الرف. ومع وجود العديد من الخوادم، يساهم كل منها في تدفق الهواء الإجمالي، يتراكم هذا الاختلاف في الضغط تدريجيًا بين الممرات الباردة والساخنة. وباستخدام أجهزة استشعار الضغط في كلا الممرين وخارج مبنى مركز البيانات، يمكننا قياس هذا الضغط التفاضلي.
تتضمن العملية الحسابية طرح بيانات مستشعر الضغط في الممر الساخن من الضغط الجوي وطرح بيانات مستشعر الضغط في الممر البارد من الضغط الجوي. كما هو الحال في المثال أدناه:
مثال من العالم الحقيقي
ثم ترشدنا القيم الناتجة في تحديد إمداد الهواء اللازم لوحدة التيار المستمر والعادم المطلوب لتعويض تشغيل مراوح الخادم. وبعبارات أبسط، نقيس احتياجات تدفق الهواء لدينا بناءً على فروق الضغط، مما يسمح لنا بإدارة عملية التبريد داخل وحدة التيار المستمر بكفاءة.
لا يتم عادةً تنفيذ أنظمة التدفئة التقليدية في مراكز البيانات التي توفر تبريدًا مجانيًا. ويُعتبر استخدام المياه غير منطقي بسبب التكلفة والمخاطر المحتملة التي قد تتعرض لها المعدات. ويشكل هذا تحديًا أثناء البرودة الشديدة، حيث تصل درجة الحرارة في الخارج إلى -20-30 درجة. وفي حين تتعامل المعدات مع هذه المشكلة بشكل جيد، يسعى المهندسون إلى اتباع نهج أكثر لطفًا. والحل الأكثر أناقة ومنطقية هنا هو إعادة استخدام الهواء الساخن الناتج عن معدات تكنولوجيا المعلومات. ومن خلال توجيه الهواء الساخن من الخوادم إلى غرفة خلط، وإعادة جزء منه إلى تيار الهواء الرئيسي، يحافظ النظام على دفء المبنى في الشتاء ويسمح بتوفير تكاليف التدفئة.
تؤكد إحدى الأطروحات الرئيسية في نظرية الموثوقية أن البساطة تولد الموثوقية. وينطبق هذا على نظام التبريد المجاني الذي يمثل مفهومًا بسيطًا بشكل ملحوظ. يعمل النظام كحاجز، حيث يمرر الهواء من الخارج عبر المرشحات، ويمرر عبر معدات تكنولوجيا المعلومات، ثم يطرده.
إن غياب الأنظمة المعقدة يعزز من الموثوقية، حيث تشكل المراوح فقط نقطة ضعف في الطقس الحار. ويجسد نهج التبريد الحر تبسيطًا جذريًا للنظام، مما يحسن الموثوقية بشكل كبير من خلال تقليل عدد العناصر.
إن السلطة الهرمية للمراوح هي سؤال أساسي آخر في ديناميكيات تدفق الهواء داخل مراكز البيانات. وكما ناقشنا، هناك مراوح كبيرة الحجم على مستوى مراكز البيانات ومراوح على مستوى الخادم. والسؤال هو: هل تقوم مراوح مركز البيانات فقط بتزويد الهواء، تاركة مراوح الخادم تستهلك ما يكفيها؟ أم أن الطلب ينشأ من مراوح الخادم، مما يجبر مراوح مركز البيانات على تلبية متطلباتها؟
الآلية هي كما يلي: تلعب مراوح الخادم دورًا مهيمنًا في هذه العملية، حيث تحدد تدفق الهواء اللازم. بعد ذلك، تستجيب مراوح التيار المستمر من خلال توصيل الحجم المطلوب من الهواء. يصبح من الواضح أنه إذا تجاوز الطلب التراكمي من جميع الخوادم سعة الإمداد لمروحة التيار المستمر، فقد يؤدي ذلك إلى ارتفاع درجة الحرارة المحتمل.
لذا فإن الإجابة هي أن مراوح الخادم لها الأولوية في هذه الديناميكية. فهي تنظم تدفق الهواء، وتحدد كمية الهواء المطلوبة.
لتقييم كفاءة مشروع مركز البيانات، يتم استخدام حساب فعالية استخدام الطاقة (PUE) بشكل تقليدي. صيغة فعالية استخدام الطاقة هي نسبة إجمالي طاقة المنشأة إلى طاقة معدات تكنولوجيا المعلومات:
PUE = إجمالي طاقة المنشأة / طاقة معدات تكنولوجيا المعلومات
من الناحية المثالية، يساوي 1، مما يدل على أن كل الطاقة موجهة إلى معدات تكنولوجيا المعلومات دون أي هدر. ومع ذلك، فإن تحقيق هذا السيناريو المثالي نادر في المشاريع الواقعية.
تنشأ مشكلة أخرى عندما نحاول وضع منهجية واضحة لحساب فعالية استخدام الطاقة (PUE). على سبيل المثال، في نظامنا، لدينا مقياس يشير إلى استهلاك الطاقة اللحظي بالواط، مما يجعل من الممكن حساب فعالية استخدام الطاقة في الوقت الفعلي.
علاوة على ذلك، يمكننا استخلاص متوسط كفاءة استخدام الطاقة على مدى فترة سنوية، وهو ما يوفر تقييمًا أكثر شمولاً بالنظر إلى التقلبات الموسمية. وهذا مهم بشكل خاص نظرًا للتفاوت في استخدام الطاقة بين المواسم؛ على سبيل المثال، التفاوت في متطلبات التبريد بين أشهر الصيف والشتاء. وهذا يعني أنه إذا أردنا الحصول على تقييم أكثر موثوقية، فنحن بحاجة إلى إعطاء الأولوية لمتوسط سنوي يوفر تقييمًا أكثر توازناً وشاملاً.
ومن المهم أيضًا استكشاف كفاءة استخدام الطاقة ليس فقط من حيث الطاقة ولكن أيضًا من حيث الوحدات النقدية، وبالتالي دمج التقلبات الموسمية لأسعار الكهرباء. إن تقييم كفاءة استخدام الطاقة من حيث القيمة النقدية يمنحنا منظورًا أكثر شمولاً للكفاءة التشغيلية.
فضلاً عن ذلك فإن هذا النهج يكشف عن إمكانيات تحقيق قيمة PUE أقل من 1 عند قياسها بالدولار. ويصبح هذا ممكناً، على سبيل المثال، عندما نستخدم الحرارة المهدرة لتسخين المياه ونبيعها إلى المدن القريبة. وتثبت أمثلة جديرة بالملاحظة، مثل مركز بيانات جوجل في الولايات المتحدة ومنشأة ياندكس في فنلندا، جدوى مثل هذه الممارسات، وخاصة في المناطق التي تتميز بتكاليف الطاقة المرتفعة.
إن المخاوف بشأن خفض التكاليف وزيادة الكفاءة غالباً ما تثير تساؤلات حول التأثيرات السلبية المحتملة على الموثوقية. ومع ذلك، أود أن أؤكد أن السعي إلى تحقيق الكفاءة في التبريد الحر لا يمس الموثوقية. بل إن الآثار الجانبية التكنولوجية قد تعزز الكفاءة. على سبيل المثال، وكما ناقشنا بالفعل، فإن إعادة توجيه الحرارة الزائدة إلى مضخات الحرارة لتحقيق فوائد إضافية، مثل توليد المياه الساخنة للمدن القريبة، تصبح ممارسة مفيدة مالياً دون التضحية بالموثوقية.
على الرغم من كل المزايا التي توفرها أنظمة التبريد المجانية، لا تزال صناعة مراكز البيانات مدفوعة بنهج محافظ وتطالب بموثوقية مثبتة، مع ميل إلى مقاومة الحلول المبتكرة. والاعتماد على الشهادات من هيئات مثل
ومع ذلك، هناك اتجاه بين الشركات الضخمة لتبني التبريد المجاني كحل رئيسي لمراكز البيانات الخاصة بها. ومع تزايد عدد الشركات التي تعترف بالفعالية من حيث التكلفة والفوائد التشغيلية لهذه التكنولوجيا، نتوقع ظهور المزيد من مراكز البيانات المبردة الخالية من الشركات في غضون السنوات العشر إلى العشرين المقبلة.