לאחרונה העברתי שיעור על שימוש במדעי הנתונים לאבטחת סייבר, תוך התמקדות בניתוח נתוני לכידת מנות - נושא מעט טכני ויבש באופן מסורתי. הגישה ששיתפתי שאבה מניסיוני באבטחת סייבר במוסדות פיננסיים, מכסה שלבי ליבה כמו ניתוח נתונים חקרני, עיבוד מקדים והמרת נתוני יומן, וזיהוי חריגות באמצעות שילוב של אשכולות וניתוח רשת גרפים.
היבט אחד מפתיע היה הזמן שהשקעתי בהכנות לפגישה הזו - חלק קטן ממה שהייתי משקיע בדרך כלל. AI מילא תפקיד משמעותי בייעול התהליך. השתמשתי בקלוד כדי לסייע בקידוד, בפיתוח המתאר ואפילו ביצירת השקופיות. בסך הכל, כל הקורס היה מוכן תוך 48 שעות.
הפגישה התבררה כמרתקת. המשתתפים, בעיקר CISOs שבדרך כלל אינם מקודדים, מצאו שהתרגילים, שנוצרו בעזרת AI, אינטואיטיביים ומעשיים. המטרה שלי הייתה לטבול אותם בעבודה ישירה עם נתונים וקוד. הם העריכו במיוחד את ההזדמנות לחקור באופן ידני מה פלטפורמות המעקב המודרניות של איומי סייבר ו-SIEM אוטומטיות בדרך כלל, תוך השגת תובנות לגבי התהליכים המתרחשים "מתחת למכסה המנוע".
המפתח שלי מהשיעור היה מפתיע באופן מנוגד לאינטואיציה: מדע הנתונים, כפי שאנו מכירים אותו, יוחלף בסופו של דבר ב-AI . תפיסה זו אולי נראית מוקדמת - או אולי הקדימה את זמנה - אבל זו פרספקטיבה שמצדיקה דיון.
אזהרה: חלק מזה עלול לעורר אנשים.
במשך למעלה מעשור, מדע הנתונים נחגג כ"העבודה הסקסית ביותר של המאה ה-21". עם זאת, ככל שה-AI מתקדם במהירות, מתברר שקשה יותר להתעלם מהאתגרים הבסיסיים של התחום. כניסתו של AI יצירתי רב עוצמה עשויה להיות נקודת המפנה לדיסציפלינה שבדיעבד אולי הוגדרה בצורה רופפת יותר והופעתה יתר על המידה ממה שהכיר בתחילה.
במהותו, מדעי הנתונים משלבים מדעי המחשב, סטטיסטיקה וחוש עסקי, ומציע לארגונים הבטחה לתובנות ניתנות לפעולה מכמויות אדירות של נתונים. ערכת מיומנויות זו היא ללא ספק בעלת ערך בעולם מונע הנתונים של היום. עם זאת, מתחת לתדמית המלוטשת שלו, התחום מתמודד עם בעיות משמעותיות. מה שמתויג לעתים קרובות כמדע נתונים מתגלה לעתים קרובות כטלאים של משימות הקשורות רופף שלא תמיד מתיישרות בצורה מסודרת, ואנשי מקצוע רבים בתחום נאבקים בכל הרוחב והמורכבות שהמשמעת דורשת.
עלייתם של כלים מונעי בינה מלאכותית המסוגלים להתמודד עם ניתוח נתונים, מודלים ויצירת תובנות עשויה לאלץ שינוי באופן שבו אנו רואים את התפקיד והעתיד של מדע הנתונים עצמו. בעוד בינה מלאכותית ממשיכה לפשט ולהפוך לאוטומטיות רבות מהמשימות הבסיסיות במדעי הנתונים, התחום עשוי לעמוד בפני חשבון נפש לגבי מה זה באמת אומר להיות מדען נתונים בעידן האוטומציה החכמה.
מדעני נתונים רבים, למרות מיומנויות קידוד מתוחכמות וכלים דיגיטליים, עוסקים בעבודה ידנית באופן מפתיע ונוטה לשגיאות . הכנת נתונים, ניקוי וניתוח כרוכים במשימות מייגעות שגוזלות זמן שחוזרות על עצמן ומכניות. למעשה, כמות משמעותית של עבודת מדעי הנתונים מושקעת בהכנת מערכי נתונים - משימה שלעתים קרובות מרגישה יותר כמו עבודת פרך מאשר המדע המרגש, מונחה הגילויים שהוא מתגלה כמדע. לבעיה זו מצטרפת העובדה שרבים שנכנסים לתחום הם, במקרה הטוב, חובבנים. לאחר שלמדו כמה קורסים מקוונים ב- Python או R, "מדעני הנתונים" הללו לרוב אינם מוכנים לקפדנות התפקיד . מדעי נתונים זה לא רק קידוד. זה כולל ניתוח מעמיק, הבנה הקשרית ויכולת להציג תובנות לקהלים לא טכניים. למען האמת, זו יותר עבודת מחקר, הדורשת שילוב של יצירתיות וחשיבה אנליטית שרבים מהתחום פשוט לא מחזיקים בהם.
יתר על כן, מדעני נתונים רבים פיתחו תחושת זכאות, ציפו למשכורות גבוהות ולחבילות משתלמות רק בזכות התואר שלהם. הגישה הזו מכבה חברות, במיוחד במגזרים שבהם יעילות העלות היא מעל הכל. פגשתי חברות שפעם מיהרו להעסיק מדעני נתונים אבל עכשיו שוקלות מחדש. למה לשלם שכר גבוה למי שמבלה את רוב זמנו בהתמודדות עם ניקוי נתונים, כשבינה מלאכותית יכולה לעשות זאת מהר יותר, טוב יותר ובחלק קטן מהעלות?
כפי שחוויתי באופן אישי את כתיבת השיעור, AI Generative התפתח לכוח רב עוצמה בתחומים שבהם מדעי הנתונים הם החלשים ביותר. משימות כמו הכנת נתונים, ניקוי ואפילו ניתוח איכותי בסיסי - פעילויות שגוזלות הרבה מזמנו של מדען נתונים - כעת אוטומטיות בקלות על ידי מערכות בינה מלאכותית . מה שגרוע יותר (או טוב יותר, תלוי איפה אתה עומד) הוא שבינה מלאכותית מהירה יותר, מדויקת יותר ופחות נוטה לטעויות אנוש או עייפות.
עבור מדעני נתונים רבים, זה יכול להיות מפחיד. אחרי הכל, משימות אלו מייצגות את עיקר העבודה היומיומית שלהם. ניקוי נתונים, למשל, ידוע לשמצה זמן רב ונוטה לטעויות, אך בינה מלאכותית יכולה כעת לבצע זאת בכמה קליקים ובדיוק כמעט מושלם. מדעני נתונים מתלוננים לעתים קרובות על משימות הרטינה הללו, אך הן מהוות בסיס לתפקידיהם. ככל שמערכות בינה מלאכותית משתפרות, הצורך של בני אדם לבצע את העבודות הללו הולך ומתמעט. זה לא מפתיע שהרבה מהביקורת הקולנית נגד AI מגיעה ממדעני נתונים עצמם . הם רואים את הכתובת על הקיר וחוששים לעבודתם.
כדי להחמיר את המצב עבור מדעני נתונים, התחום לא התקדם משמעותית בשנים האחרונות. למרות העלייה המטאורית בפופולריות שלו, מדעי הנתונים עדיין נגועים בחוסר יעילות, שגיאות וחוסר בהירות מה בדיוק זה צריך לכלול . פעם האמינו שכלים מתוחכמים יותר והכשרה טובה יותר יפתחו את התחום, אבל זה לא התממש במידה המצופה. לעומת זאת, הבינה המלאכותית השתפרה בהתמדה. אלגוריתמים של למידת מכונה, עיבוד שפה טבעית ומודלים מחוללים מתפתחים במהירות, ומשאירים את מדע הנתונים המסורתיים באבק.
שוב, ציפיות השכר הגבוהות של מדעני נתונים מחמירות את הנושא . חברות שייתכן שפעם היו סובלות חוסר יעילות מבינות כעת שבינה מלאכותית יכולה להחליף הרבה מעבודת הרטינה ללא תג המחיר הכבד שמוצמד לעבודה אנושית. עם הבינה המלאכותית שהופכת מיומנת יותר בביצוע משימות מפתח כמו ניתוח, חיזוי ואפילו הצגה, האופי הידני של מדעי הנתונים הופך ליותר ויותר מיותר. חברות רבות יבינו שמה שנדרש בעבר צוות של מדעני נתונים יכול כעת להיות מטופל ביעילות רבה יותר על ידי כלים המונעים בינה מלאכותית.
המציאות היא שמדעי הנתונים, כפי שהוגדרו באופן מסורתי, נמצאים על סף התיישנות. עם התקדמות הבינה המלאכותית הגנרטיבית בקצב מדהים, סביר להניח שהביקוש למדעני מידע אנושי בצורתם הנוכחית ירד . זה לא אומר שלבני אדם אין תפקיד בקבלת החלטות מונעת נתונים, אבל התפקיד הקלאסי של "מדען נתונים" עשוי להיות בקרוב מושג של העבר. מה שדרוש כעת הם אנשי מקצוע המיומנים בשיתוף פעולה עם AI, רתימת היכולות שלו תוך התמקדות בחשיבה אסטרטגית ופתרון בעיות מורכבות ברמה גבוהה יותר.
בינה מלאכותית היא לא הסוף של ניתוח, תובנות או קבלת החלטות - היא מייצגת את האבולוציה שלהן . התחום הנוכחי של מדעי הנתונים מסתכן בהתיישן אם הוא לא יתפתח בצעד. בינה מלאכותית כבר עושה מהפכה בתעשיות, ומדע הנתונים חייב להסתגל או להסתכן בעקיפה של הגל הזה. בסופו של דבר, יתכן והשאלה אינה האם בינה מלאכותית תבטל את מדעי הנתונים, אלא האם מדע הנתונים מילא אי פעם את ההבטחות שלו.
או שאולי ההבחנה אפילו לא משנה אם סוף סוף נעבור אל מעבר להייפ של "מדעי הנתונים" ונאמץ את AI כהתקדמות ההגיונית הבאה.
אודותיי: ותיק IT בן 25+ בשילוב נתונים, בינה מלאכותית, ניהול סיכונים, אסטרטגיה וחינוך. מנצח בהאקתון פי 4 והשפעה חברתית של עו"ד נתונים. פועל כעת להזניק את כוח העבודה בינה מלאכותית בפיליפינים. למידע נוסף עלי כאן: https://docligot.com