paint-brush
אופטימיזציה של יעילות מרכז הנתונים: צלילה עמוקה לתוך טכניקות קירור חופשיעל ידי@egorkaritskii
100,098 קריאות
100,098 קריאות

אופטימיזציה של יעילות מרכז הנתונים: צלילה עמוקה לתוך טכניקות קירור חופשי

על ידי Egor Karitskii10m2024/05/14
Read on Terminal Reader
Read this story w/o Javascript

יותר מדי זמן; לקרוא

גלה את הפוטנציאל הטרנספורמטיבי של טכנולוגיית קירור חינם במרכזי נתונים, תוך בחינת היתרונות, האתגרים וההשפעה שלה על היעילות והאמינות. גלה כיצד הפתרון הירוק הזה מחולל מהפכה באסטרטגיות הקירור ומעצב את עתיד תפעול מרכזי הנתונים.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail

Coin Mentioned

Mention Thumbnail
featured image - אופטימיזציה של יעילות מרכז הנתונים: צלילה עמוקה לתוך טכניקות קירור חופשי
Egor Karitskii HackerNoon profile picture
0-item
1-item


במאמר הקודם , דנו בהתרחבות המהירה של תשתית מרכז הנתונים והגידול בצריכת החשמל שהביאה אליה. כאשר שרתים ממירים חשמל לחום במהלך הפעולה, ניהול טמפרטורות גבוהות וקירור מתקני מרכז הנתונים והציוד הופכים לבעיה מספר 1 עבור צוותי DC.


בעוד ששיטות קירור מסורתיות, כולל מזגנים וצ'ילרים, מצננים ביעילות את הנחות והשרתים של מרכז הנתונים, העלות שלהן נותרה חיסרון משמעותי. קירור חופשי בניגוד לשיטות המסורתיות אינו דורש השקעות משמעותיות אך מציע את אותה רמת יעילות ואמינות. במאמר זה, אעשה סקירה מפורטת של טכנולוגיית הקירור החינמי, ואדגיש את היתרונות שלה, המגבלות והדרישות ליישום מוצלח.


פיזיקה של קירור חופשי

כדי להבין את הפיזיקה מאחורי קירור חופשי, נצטרך לבדוק מחדש את נוסחת אנרגיית החום:


Q = mcΔT


כאן, 'Q' מייצג את כמות החום שנצבר או אבד, 'm' מייצג את המסה של המדגם (במקרה שלנו, מסת האוויר במרכז הנתונים), 'c' מציין את קיבולת החום הספציפית של האוויר, ו- ΔT מסמל את הפרש הטמפרטורה.


במרכז נתונים, מקור החום העיקרי הוא המעבד. בדרך כלל, ישנם 2 עד 4 מעבדים, שכל אחד מהם פועל בהספק של כ-200 וואט. כפי שנדון קודם לכן, כל האנרגיה החשמלית הנצרכת על ידי המעבדים מומרת לחום. לכן, עם 2 מעבדים, למשל, אנו מייצרים 400 וואט של חום שצריך לפזר. כעת המטרה שלנו היא לקבוע את כמות האוויר הנדרשת למטרה זו.


הפרמטר ΔT, או הפרש טמפרטורה, מציין שככל שטמפרטורת האוויר החיצונית נמוכה יותר, כך נדרשת פחות מסת אוויר לקירור המעבדים. לדוגמה, אם טמפרטורת האוויר בכניסה היא 0°C וטמפרטורת היציאה היא 35°C, ΔT יהיה רק 35, מה שמסמל דרישה נמוכה למדי למסת אוויר. עם זאת, בעונת הקיץ, הקירור הופך למאתגר יותר עקב עליית טמפרטורות הסביבה. ככל שהטמפרטורה החיצונית גבוהה יותר, כך תידרש כמות האוויר גדולה יותר לקירור השרתים.



מגבלות טמפרטורה של רכיבי שרת ורשת

למרות שקירור חופשי עשוי להיות יעיל באקלים מתון וקר, עדיין יש לו מגבלות עקב אילוצי טמפרטורה על רכיבי השרת. לרכיבים קריטיים בציוד IT ורשת, כגון מעבדים, זיכרון RAM, כונני HDD, SSD וכונני NVMe, יש דרישות טמפרטורה תפעוליות:


  • מעבדים: מקסימום 89 מעלות צלזיוס
  • זיכרון RAM: מקסימום 75 מעלות צלזיוס
  • דיסקים קשיחים: מקסימום 50°C
  • כונני SSD וכונני NVMe: מקסימום 47-48 מעלות צלזיוס


מגבלות אלו משפיעות ישירות על ההתאמה של טמפרטורות אוויר חיצוניות לקירור. קירור חופשי לא יהיה בר-קיימא באזורים שבהם טמפרטורות חיצוניות עולות על הסף הזה או אפילו מתקרבות אליהם, מכיוון שהוא עלול להזיק למערכת עקב התחממות יתר. מגבלות אזוריות

כפי שכבר הסברנו, טמפרטורות חיצוניות חייבות להישאר בעקביות נמוכות מהטמפרטורות התפעוליות המקסימליות של ציוד ה-IT כדי שקירור חופשי יהיה יעיל. זה מחייב שיקול זהיר של תנאי האקלים של מיקום DC. ארגונים חייבים לנתח תחזיות מזג אוויר ארוכות טווח כדי להבטיח שהטמפרטורות לא יחרגו מהסף הנדרש, אפילו בימים או שעות ספציפיות. בנוסף, בהתחשב באורך החיים הארוך של מרכזי נתונים (בדרך כלל 10-15 שנים), יש להביא בחשבון את ההשפעות של ההתחממות הגלובלית בהחלטות המיקום.



דרישות ארכיטקטורת צומת שרת

בהקשר של פיזיקה, השגת קירור יעיל בשרתים מסתמכת על הבטחת זרימת אוויר בשפע דרך המערכת. לארכיטקטורת השרת יש תפקיד חשוב בתהליך זה.


דוגמה לארכיטקטורת שרתים הכוללת חורי אוורור המאפשרים את זרימת האוויר הדרושה ומאפשרים קירור חופשי יעיל


לעומת זאת, שרתים חסרי תכונות עיצוב מתאימות, כגון נקבים או פתחים, עלולים לעכב את זרימת האוויר, מה שעלול לפגוע ביעילות הכוללת של מנגנון הקירור החופשי.


בקרת לחות

רמת הלחות היא שיקול קריטי נוסף בכל הנוגע לקירור חופשי. מכיוון שאין לנו שליטה על תנאי הלחות החיצוניים עולות שתי פניות רלוונטיות: ראשית, התייחסות לרמות לחות המתקרבות או עולות על 100% בתוך מרכז הנתונים (DC); שנית, התייחסות לתרחישים של לחות אוויר נמוכה מאוד, כגון במהלך יום כפור בפברואר עם טמפרטורה חיצונית של -30 מעלות צלזיוס ולחות יחסית הנעה בין 2% ל-5%. הבה נבחן באופן שיטתי את המצבים הללו.


בתנאים של לחות מוגברת, קיים חשש נפוץ לגבי התרחשות פוטנציאלית של עיבוי והשפעותיו השליליות על תפקוד הציוד. בניגוד לחשש זה, בתוך אזורי הקירור מחדש של ה-DC, שבהם מתרחש תהליך הקירור, עיבוי נמנע. זה נובע מהעיקרון שעיבוי מתרחש כאשר אוויר חם ולח בא במגע עם משטחים קרים יותר. עם זאת, בתוך מערכת הקירור החופשי של ה-DC, אין אלמנט קר יותר מהאוויר שמסביב. כתוצאה מכך, עיבוי מובנה מטבעו, ומבטל את הצורך באמצעים יזומים.


להיפך, כאשר מתמודדים עם לחות נמוכה, החשש עובר לכיוון ייצור חשמל סטטי, המהווה איום על יציבות הציוד. בעיה זו אינה קשורה לעיבוי אך דורשת פתרון ייחודי. הקלה כוללת הליכי הארקה ויישום של ציפוי רצפה מיוחד. אמצעים אלה עולים בקנה אחד עם שיטות מבוססות להגנה על ציוד פנימי מפני חשמל סטטי. על ידי הארקת רכיבי בנייה, מתלים וציוד IT, מטען סטטי מתפזר ללא מזיק לקרקע, ומשמר את שלמות הציוד.


באקלים הטבעי, מקרים של לחות גבוהה או נמוכה ביותר מתרחשים לעתים רחוקות. חריגים בולטים כוללים אירועים נדירים כגון סופת רעמים המשיגה 100% לחות ביולי או כפור קשה הגורם ללחות נמוכה מאוד. עם זאת, במשך רוב הזמן רמות הלחות נשארות בטווחים מקובלים שאינם גורמים נזק לציוד, אפילו בהיעדר התערבויות אקטיביות.


כמות ומהירות אוויר

כפי שכבר דיברנו, כדי להקל על קירור יעיל אנו זקוקים לנפח משמעותי של אוויר חיצוני. במקביל, מופיעה דרישה לכאורה מנוגדת לאינטואיציה - שמירה על זרימת אוויר נמוכה בתוך הבניין. הפרדוקס לכאורה הזה מושרש באתגרים שמציבים זרמי אוויר מהירים שמסתובבים בתוכו.


כדי לפשט, דמיינו מהירות אוויר גבוהה כזרם חזק מצינור, היוצר מערבולות ומערבולת סביב ציוד ה-IT. מערבולת זו עשויה להוביל לתנועות אוויר לא סדירות ולהתחממות יתר מקומית. כדי להתמודד עם זה, אנו שואפים אסטרטגית למהירות אוויר נמוכה כוללת של 1-2 מטר לשנייה בכל החלל.


שמירה על מהירות אוויר מבוקרת זו מאפשרת לנו לחסל מערבולות. מהירות גבוהה יותר תסכן אי סדרים בתנועת האוויר. על ידי הקפדה על טווח של 1-2 מטרים לשנייה, אנו מטפחים זרימת אוויר חלקה ואחידה, תוך הימנעות מחימום יתר מקומי. איזון עדין זה מבטיח קירור אופטימלי של ציוד IT על ידי עקיפה מהמלכודות הקשורות לזרמי אוויר מהירים.


כפי שניתן לראות, גישת הקירור החופשי סובבת סביב שימוש יעיל באוויר חיצוני תוך מתן עדיפות למהירות אוויר פנימית נמוכה מבוקרת. אסטרטגיה מכוונת זו עוזרת לשמור על זרימת אוויר למינרית ואחידה, ומבטיחה את האפקטיביות של קירור ציוד IT.


קונספט בנייה

בפרדיגמת הקירור החופשי, תעלות אוויר מסורתיות אינן מועסקות בתוך מבנה הבניין. בניגוד להגדרות קונבנציונליות עם תעלות אוויר ייעודיות בקירות, תקרות או אזורים ספציפיים, מרכזי עיבוד נתונים מאמצים גישה לא שגרתית. הבניין עצמו מתוכנן כצינור אוויר, מה שהופך את יחידות המיזוג המסורתיות למיושנות. קנה המידה העצום של תעלות האוויר הללו הופך אותם למרכיבים אינטגרליים של חדרים ורצפות.


תיאור סכמטי של עיצוב הבניין בקירור חופשי


תהליך זרימת האוויר מתחיל כאשר אוויר חיצוני נכנס למבנה, עובר דרך שני סוגי מסננים - מסננים גסים ומסננים עדינים. לאחר שהאוויר עובר את תהליך הניקוי, הוא מונע על ידי מאווררים לתוך נפחי בניין רחבים, שווה ערך לגובה של ארבע קומות. נפח משמעותי זה משרת את המטרה שלו: להאט את זרימת האוויר, הפחתת מהירותו לטווח הנדרש של 1-2 מטר לשנייה. לאחר מכן, האוויר יורד לחדר המכונות.


לאחר חציית חדר המכונות, האוויר ממשיך במסעו דרך מדפי IT, ומתקדם אל המעבר החם. משם, הוא נכנס לקולט האוויר החם לפני שהוא יוצא החוצה דרך מאווררי פליטה. נתיב זרימת אוויר מובנה זה מבטיח תהליך קירור יעיל תוך שמירה על מהירות אוויר מבוקרת.


מהירות אוויר ונפח

הבחירה העיצובית המכוונת של שימוש בנפחי בניין רחבים משרתת מטרה כפולה. בראש ובראשונה, הוא מאפשר הפחתה הדרגתית של מהירות האוויר, ומבטיח שזרימת האוויר משיגה את המהירות הרצויה של 1-2 מטר לשנייה. מהירות אוויר מבוקרת זו חיונית כדי למנוע מערבולות ולשמור על זרימה למינרית, חשובה במיוחד כאשר האוויר מתקדם דרך ציוד IT רגיש. שנית, הנפח המשמעותי מכיל את נפח האוויר הדרוש לפיזור החום הנוצר ביעילות. המשחק המסונכרן בין מהירות אוויר ונפח תורם להצלחה הכוללת של המערכת.


לחץ דיפרנציאלי כמנהל ההתקן הבלעדי לניהול

בהגדרת קירור חופשי, אין לנו שליטה על טמפרטורת האוויר החיצונית, מה שמוביל לשינויים בטמפרטורת האוויר הנכנסת למרכז הנתונים (DC). למרות זאת, חיוני להעריך את זרימת האוויר הנדרשת לקירור הציוד. כדי לטפל בזה, אנו מסתמכים על שיטת הלחץ ההפרש.


בתוך כל מתלה IT, שרתים עם מאווררים פנימיים פועלים במהירויות שונות, ויוצרים ביחד הפרש לחץ בין החלק הקדמי והאחורי של המדף. עם שרתים רבים, שכל אחד מהם תורם לזרימת האוויר הכוללת, הפרש הלחץ הזה מצטבר בהדרגה בין המעברים הקרים והחמים. באמצעות חיישני לחץ בשני המעברים ומחוץ לבניין DC, אנו יכולים למדוד את הלחץ ההפרש הזה.


החישוב כולל הפחתת נתוני חיישן הלחץ במעבר החם מהלחץ האטמוספרי והפחתת נתוני חיישן הלחץ במעבר הקר מהלחץ האטמוספרי. כך כמו בדוגמה למטה:


דוגמה בעולם האמיתי


לאחר מכן הערכים המתקבלים מנחים אותנו בקביעת אספקת האוויר הנחוצה ל-DC והפליטה הנדרשת כדי לקזז את פעולת מאווררי השרת. במילים פשוטות יותר, אנו מודדים את צרכי זרימת האוויר שלנו בהתבסס על הפרשי הלחץ, מה שמאפשר לנו לנהל את תהליך הקירור בתוך ה-DC ביעילות.


חדר חימום וערבוב

מערכות החימום המסורתיות בדרך כלל אינן מיושמות במרכזי נתונים עם קירור חופשי. שימוש במים נחשב לא רציונלי בשל עלות וסיכונים פוטנציאליים לציוד. זה מהווה אתגר בזמן הצטננות קיצונית, שמגיע ל-20-30 מעלות בחוץ. בעוד שהציוד מתמודד עם זה היטב, המהנדסים מחפשים גישה עדינה יותר. הפתרון האלגנטי וההגיוני ביותר כאן הוא שימוש חוזר באוויר חם שנוצר על ידי ציוד IT. הפניית האוויר החם מהשרתים לתא ערבוב, והחזרת חלק ממנו לזרם האוויר הראשי, המערכת שומרת על חום המקום בחורף ומאפשרת לחסוך בעלויות בחימום.


פשטות ואמינות

תזה מרכזית בתורת המהימנות טוענת שפשטות מולידה מהימנות. זה נכון למערכת הקירור החינמית, העומדת בתור קונספט פשוט להפליא. המערכת מתפקדת כמחסום, מכניסה אוויר מבחוץ דרך מסננים, מעבירה אותו דרך ציוד IT, ואז פשוט מוציאה אותו.


היעדר מערכות מורכבות משפר את האמינות, כאשר רק מאווררים מהווים פגיעות במזג אוויר חם. גישת הקירור החופשי מדגימה פישוט מערכות רדיקלי, ומשפרת משמעותית את האמינות על ידי הפחתת מספר האלמנטים.


אוהדי DC מול אוהדי שרת

הסמכות ההיררכית של המאווררים היא עוד שאלה מהותית בדינמיקה של זרימת אוויר בתוך DCs. כפי שדיברנו, ישנם מאווררים בקנה מידה גדול ברמת DC וכאלה ברמת השרת. השאלה היא: האם מאווררי מרכז הנתונים רק מספקים אוויר, ומשאירים את מאווררי השרת לצרוך כמה שצריך? או שמא הביקוש נובע ממאווררי השרת, מה שמחייב את מאווררי DC למלא את הדרישות שלהם?


המנגנון הוא כדלקמן: למאווררי השרת יש תפקיד דומיננטי בתהליך זה, בקביעת זרימת האוויר הדרושה. לאחר מכן, מאווררי DC מגיבים על ידי אספקת נפח האוויר הנדרש. ברור שאם הביקוש המצטבר מכל השרתים עולה על קיבולת האספקה של מאוורר DC, זה יכול להוביל להתחממות יתר.

אז התשובה היא שלמעריצי השרת יש את הבכורה בדינמיקה הזו. הם מתזמרים את זרימת האוויר, ומציינים את כמות האוויר הדרושה.


חישוב יעילות ו-PUE

כדי להעריך את היעילות של פרויקט DC, נעשה שימוש מסורתי בחישוב של יעילות השימוש בכוח (PUE). הנוסחה ל-PUE היא היחס בין כוח המתקן הכולל להספק ציוד IT:


PUE = Power Facility Power / Power Equipment Power


באופן אידיאלי, זה שווה ל-1, מה שמסמל שכל האנרגיה מופנית לציוד IT ללא כל בזבוז. עם זאת, השגת התרחיש המושלם הזה היא נדירה בפרויקטים בעולם האמיתי.


בעיה נוספת מתעוררת כאשר אנו מנסים לבסס מתודולוגיה ברורה למיחשוב יעילות השימוש בכוח (PUE). כך, למשל, במערכת שלנו יש לנו מדד המציין צריכת חשמל מיידית בוואט, מה שמאפשר לחשב PUE בזמן אמת.


יתרה מכך, אנו יכולים לגזור PUE ממוצע על פני תקופה שנתית, מה שמציע הערכה מקיפה יותר בהתחשב בתנודות עונתיות. זה רלוונטי במיוחד לאור הפער בשימוש באנרגיה בין עונות השנה; למשל, הפער בדרישות הקירור בין חודשי הקיץ לחורף. המשמעות היא שאם ברצוננו לקבל הערכה אמינה יותר, עלינו לתעדף ממוצע שנתי המספק הערכה מאוזנת ומקיפה יותר.


חשוב גם לחקור PUE לא רק במונחים של אנרגיה אלא גם ביחידות כספיות, ובכך לשלב את התנודות העונתיות של מחירי החשמל. הערכת PUE במונחים כספיים נותנת פרספקטיבה הוליסטית יותר על יעילות תפעולית.


חוץ מזה, גישה זו חושפת אפשרויות להשיג ערך PUE של פחות מ-1 כאשר נמדד בדולרים. זה מתאפשר, למשל, כאשר אנו משתמשים בחום הפסולת לחימום מים ומוכרים אותו הלאה לערים הסמוכות. דוגמאות ראויות לציון, כמו מרכז הנתונים של גוגל בארה"ב והמתקן של Yandex בפינלנד, מדגימות את כדאיותן של שיטות כאלה, במיוחד באזורים המאופיינים בעלויות אנרגיה גבוהות.


יעילות מול אמינות

דאגות לגבי הפחתת עלויות והגברת היעילות מעוררות לעתים קרובות שאלות לגבי השפעות שליליות אפשריות על האמינות. עם זאת, ברצוני להדגיש כי בקירור חופשי השאיפה ליעילות אינה מתפשרת על אמינות. במקום זאת, תופעות הלוואי הטכנולוגיות שלו יכולות אפילו לשפר את היעילות. לדוגמה, כפי שכבר דיברנו, הפניית חום עודף למשאבות חום עבור יתרונות נוספים, כמו הפקת מים חמים לערים סמוכות, הופכת לפרקטיקה מועילה מבחינה כלכלית מבלי לוותר על האמינות.



עתיד הקירור החופשי

למרות כל היתרונות שמציעה קירור חינם, תעשיית מרכז הנתונים עדיין מונעת על ידי גישה שמרנית ודורשת אמינות מוכחת, עם נטייה להתנגד לפתרונות חדשניים. ההסתמכות על אישורים מגופים כמו מכון Uptime לשיווק מהווה מכשול נוסף לפתרונות קירור חינם, חסרי הסמכה מבוססת, מה שמוביל ספקים מסחריים לראות אותם בספקנות.


עם זאת, קיימת מגמה בקרב מכשירי היפר-scalers לאמץ קירור חופשי כפתרון העיקרי עבור ה-DC שלהם. עם מספר גדל והולך של חברות שמכירות בעלות-תועלת וביתרונות התפעוליים של טכנולוגיה זו, אנו צופים כי יותר מרכזי נתונים לקירור ללא תאגידים יופיעו ב-10-20 השנים הבאות.