paint-brush
הסקרים נראים טוב עבור האריס. עם שגיאת הסקר של 2016/20, היא בבעיה נכון לעכשיועל ידי@maxspeicher
472 קריאות
472 קריאות

הסקרים נראים טוב עבור האריס. עם שגיאת הסקר של 2016/20, היא בבעיה נכון לעכשיו

על ידי Maximilian Speicher3m2024/09/26
Read on Terminal Reader

יותר מדי זמן; לקרוא

התחלתי לשחק עם נתוני סקרים זמינים לציבור עבור הבחירות לנשיאות ארה"ב ב-2024. אני מחשיב רק סוקרים איכותיים אבל בלי לשקלל את הסקרים שלהם אחרת. אני מתמקד ב-7 המדינות המתנדנדות שהולכות להכריע את הבחירות. 2024 תהיה הרבה יותר דומה ל-2020 ו-2016 מאשר לכל מערכת בחירות לפני כן.
featured image - הסקרים נראים טוב עבור האריס. עם שגיאת הסקר של 2016/20, היא בבעיה נכון לעכשיו
Maximilian Speicher HackerNoon profile picture
0-item

אז, התחלתי לשחק עם נתוני הסקרים הזמינים לציבור של FiveThirtyEight . מַדוּעַ? כי אני פשוט מתעניין בסקרים סביב הבחירות לנשיאות ארה"ב ב-2024 ובצד הסטטיסטי של הדברים ותהיתי איך אבנה את התחזית הקטנה שלי מאפס. אז הנה מה שעשיתי לניסיון ראשון.


(הצהרה: אני לא מדען נתונים מקצועי. לשחק עם הנתונים ולחקור כמה דברים זה באמת הפוקוס העיקרי שלי.)


בראש ובראשונה, אני רוצה לשמור את זה פשוט לעת עתה. כפי שמסביר כהנמן בספרו, רעש : מודלים פשוטים לרוב עושים את העבודה די טוב.


לכן, אני מחשיב רק סוקרים איכותיים אך מבלי לשקול את הסקרים שלהם אחרת. אני כולל רק נקודות נתונים עם numeric_grade ≥2.5 (הטוב ביותר: 3) במערך הנתונים של 538.


מה שאני כן שוקל זה קרבה ליום הבחירות. ככל שהסקר קרוב יותר ל-5 בנובמבר, כך הסקר רלוונטי יותר. אני מחשיב סקרים של עד 90 ימים (~3 חודשים) לפני, משוקלל ליניארי. לסקר המסתיים ב-7 באוגוסט יש משקל של 1/90, וסקר שמסתיים ב-4 בנובמבר הוא אחד של 90/90.


לבסוף, אני לא מסתכל על סקרים לאומיים. מה שאני מתמקד בו הן 7 המדינות המתנדנדות שהולכות להכריע את הבחירות.


עם כל זה, אנו מגיעים לתמונה הבאה נכון ל-24 בספטמבר. האריס מלפנים ב-MI, NV, NC, PA, WI; טראמפ ב-AZ & GA.



בהתבסס על הסתברויות אלה, נוכל גם לחשב את הקולות האלקטורליים הצפויים (EVs) עבור כל מדינה נדנדה, ואת המירוץ הכולל:



עם זאת, זה לא לוקח בחשבון שגיאת סקרים, שהייתה משמעותית גם ב-2016 וגם ב-2020. אז עשיתי גם ①–③ עבור שני אלה. אני לא שוקל בחירות לפני כן כי מאז שטראמפ נכנס לבמה, דינמיקת הבחירות השתנתה באופן משמעותי. כללים ישנים לא חלים יותר. 2024 תהיה הרבה יותר דומה ל-2020 ו-2016 מאשר לכל מערכת בחירות לפני כן. שגיאת הסקרים עבור המתודולוגיה שלי נראית כך:



בהתאם לכלל "שמור על פשטות", נניח שטעות הסקרים בשנת 2024 תהיה הממוצע של 2016/20 ונחיל אותה על השוליים מלמעלה, ונוסיף גם את אי הוודאות בשגיאת הסקרים לאי הוודאות מהסקרים:



ושוב, אלה הם ה-EV הצפויים בהתבסס על ההסתברויות:



כעת, אפשר לטעון שאולי הסוקרים למדו את הלקח שלהם והסקר יחזור להיות מדויק יותר השנה. עם זאת, זה כבר היה ויכוח בשנת 2020. בנוסף, נראה שלפחות חלק מהבעיה היא שתומכי טראמפ פשוט לא רוצים להשתתף בסקרים יותר בגלל בעיות אמון (ראה, למשל, https://www.cnbc.com/2024/05/04/why-election-polls-were-wrong-in-2016-and-2020-and-whats-changing.html ).


ברור שסוקרים מנסים ללמוד ולהתאים את עצמם, אבל אם הם יהיו פחות מוזלים השנה מאשר בשתי הבחירות שלפני כן, נראה רק ב-5 בנובמבר. לעת עתה, אני גם לא לוקח שגיאות סקרים מ-2022 בחירות בחשבון. אני צריך לקרוא עוד על זה קודם, ואני מניח שבחירות לנשיאות דומות ביותר לבחירות אחרות לנשיאות.


אז, לניסיון הראשון הזה, התחזית הקטנה שלי כוללת תחזית אחת המבוססת אך ורק על סקרים משוקללים של סוקרים איכותיים, ותחזית אחת בהנחה ששגיאת הסקרים של 2024 תהיה הממוצע של 2016 ו-2020.


אנא אל תהסס לגשת אל Github שלי - שם אאסוף ואאחסן הכל - ולהסתכל על הנתונים והחישובים המלאים בקובץ האקסל האחרון: https://github.com/maxspeicher/2024-us-presidential -בְּחִירָה/

L O A D I N G
. . . comments & more!

About Author

Maximilian Speicher HackerNoon profile picture
Maximilian Speicher@maxspeicher
Computer scientist, designer, part-time philosopher. I write, mostly about design and user experience.

תלו תגים

מאמר זה הוצג ב...