Entonces, comencé a jugar con
(Descargo de responsabilidad: no soy un científico de datos profesional. Jugar con los datos y explorar algunas cosas es realmente mi principal objetivo).
En primer lugar, quiero que sea sencillo por ahora. Como explica Kahneman en su libro Noise : los modelos simples suelen cumplir bastante bien su función.
① Por lo tanto, solo tengo en cuenta a los encuestadores de alta calidad, pero sin ponderar sus encuestas de manera diferente. Solo incluyo puntos de datos con una numeric_grade
≥2,5 (mejor: 3) en el conjunto de datos de 538.
② Lo que sí pondero es la cercanía al día de las elecciones. Cuanto más cerca esté el 5 de noviembre, más relevante será la encuesta. Considero las encuestas realizadas hasta 90 días (~3 meses) antes, ponderadas linealmente. Una encuesta que finaliza el 7 de agosto tiene una ponderación de 1/90, y una encuesta que finaliza el 4 de noviembre tiene una ponderación de 90/90.
③ Por último, no me fijo en las encuestas nacionales. Me centro en los siete estados clave que decidirán las elecciones.
Con todo esto, llegamos a la siguiente imagen al 24 de septiembre. Harris al frente en MI, NV, NC, PA, WI; Trump en AZ y GA.
Con base en estas probabilidades, también podemos calcular los votos electorales esperados (VE) para cada estado clave y para la contienda en general:
④ Sin embargo, esto no tiene en cuenta el error de sondeo, que fue significativo tanto en 2016 como en 2020. Por lo tanto, también hice ①–③ para esos dos. No estoy considerando las elecciones anteriores porque desde que Trump entró en escena, la dinámica electoral ha cambiado significativamente. Las viejas reglas ya no se aplican. 2024 será mucho más similar a 2020 y 2016 que a cualquier elección anterior. El error de sondeo para mi metodología se ve así:
Siguiendo la regla de “mantenerlo simple”, supongamos que el error de las encuestas en 2024 será el promedio de 2016/20 y apliquémoslo a los márgenes anteriores, agregando también la incertidumbre del error de las encuestas a la incertidumbre de las encuestas:
Y, de nuevo, estos son los EV esperados en función de las probabilidades:
Ahora bien, se podría argumentar que los encuestadores tal vez hayan aprendido la lección y que las encuestas volverán a ser más precisas este año. Sin embargo, esto ya fue un argumento en 2020. Además, al menos parte del problema parece ser que ciertos partidarios de Trump simplemente ya no quieren participar en las encuestas debido a problemas de confianza (véase, por ejemplo,
Obviamente, los encuestadores están tratando de aprender y adaptarse, pero si este año se equivocarán menos que en las dos elecciones anteriores, solo lo veremos el 5 de noviembre. Por ahora, tampoco tengo en cuenta los errores de las encuestas de las elecciones de 2022. Tengo que leer más sobre esto primero y supongo que una elección presidencial es más similar a otras elecciones presidenciales.
Entonces, para este primer intento, mi propio pequeño pronóstico incluye una predicción basada puramente en encuestas ponderadas de encuestadores de alta calidad y una predicción que supone que el error de encuesta de 2024 será el promedio de 2016 y 2020.
No dudes en dirigirte a mi Github, donde recopilaré y archivaré todo, y echar un vistazo a los datos y cálculos completos en el último archivo de Excel: https://github.com/maxspeicher/2024-us-presidential-election/