אז, התחלתי לשחק עם
(הצהרה: אני לא מדען נתונים מקצועי. לשחק עם הנתונים ולחקור כמה דברים זה באמת הפוקוס העיקרי שלי.)
בראש ובראשונה, אני רוצה לשמור את זה פשוט לעת עתה. כפי שמסביר כהנמן בספרו, רעש : מודלים פשוטים לרוב עושים את העבודה די טוב.
① לכן, אני מחשיב רק סוקרים איכותיים אך מבלי לשקול את הסקרים שלהם אחרת. אני כולל רק נקודות נתונים עם numeric_grade
≥2.5 (הטוב ביותר: 3) במערך הנתונים של 538.
② מה שאני כן שוקל זה קרבה ליום הבחירות. ככל שהסקר קרוב יותר ל-5 בנובמבר, כך הסקר רלוונטי יותר. אני מחשיב סקרים של עד 90 ימים (~3 חודשים) לפני, משוקלל ליניארי. לסקר המסתיים ב-7 באוגוסט יש משקל של 1/90, וסקר שמסתיים ב-4 בנובמבר הוא אחד של 90/90.
③ לבסוף, אני לא מסתכל על סקרים לאומיים. מה שאני מתמקד בו הן 7 המדינות המתנדנדות שהולכות להכריע את הבחירות.
עם כל זה, אנו מגיעים לתמונה הבאה נכון ל-24 בספטמבר. האריס מלפנים ב-MI, NV, NC, PA, WI; טראמפ ב-AZ & GA.
בהתבסס על הסתברויות אלה, נוכל גם לחשב את הקולות האלקטורליים הצפויים (EVs) עבור כל מדינה נדנדה, ואת המירוץ הכולל:
④ עם זאת, זה לא לוקח בחשבון שגיאת סקרים, שהייתה משמעותית גם ב-2016 וגם ב-2020. אז עשיתי גם ①–③ עבור שני אלה. אני לא שוקל בחירות לפני כן כי מאז שטראמפ נכנס לבמה, דינמיקת הבחירות השתנתה באופן משמעותי. כללים ישנים לא חלים יותר. 2024 תהיה הרבה יותר דומה ל-2020 ו-2016 מאשר לכל מערכת בחירות לפני כן. שגיאת הסקרים עבור המתודולוגיה שלי נראית כך:
בהתאם לכלל "שמור על פשטות", נניח שטעות הסקרים בשנת 2024 תהיה הממוצע של 2016/20 ונחיל אותה על השוליים מלמעלה, ונוסיף גם את אי הוודאות בשגיאת הסקרים לאי הוודאות מהסקרים:
ושוב, אלה הם ה-EV הצפויים בהתבסס על ההסתברויות:
כעת, אפשר לטעון שאולי הסוקרים למדו את הלקח שלהם והסקר יחזור להיות מדויק יותר השנה. עם זאת, זה כבר היה ויכוח בשנת 2020. בנוסף, נראה שלפחות חלק מהבעיה היא שתומכי טראמפ פשוט לא רוצים להשתתף בסקרים יותר בגלל בעיות אמון (ראה, למשל,
ברור שסוקרים מנסים ללמוד ולהתאים את עצמם, אבל אם הם יהיו פחות מוזלים השנה מאשר בשתי הבחירות שלפני כן, נראה רק ב-5 בנובמבר. לעת עתה, אני גם לא לוקח שגיאות סקרים מ-2022 בחירות בחשבון. אני צריך לקרוא עוד על זה קודם, ואני מניח שבחירות לנשיאות דומות ביותר לבחירות אחרות לנשיאות.
אז, לניסיון הראשון הזה, התחזית הקטנה שלי כוללת תחזית אחת המבוססת אך ורק על סקרים משוקללים של סוקרים איכותיים, ותחזית אחת בהנחה ששגיאת הסקרים של 2024 תהיה הממוצע של 2016 ו-2020.
אנא אל תהסס לגשת אל Github שלי - שם אאסוף ואאחסן הכל - ולהסתכל על הנתונים והחישובים המלאים בקובץ האקסל האחרון: https://github.com/maxspeicher/2024-us-presidential -בְּחִירָה/