paint-brush
Meningsmålingerne ser godt ud for Harris. Med 2016/20 afstemningsfejlen er hun i problemer lige nuved@maxspeicher
Ny historie

Meningsmålingerne ser godt ud for Harris. Med 2016/20 afstemningsfejlen er hun i problemer lige nu

ved Maximilian Speicher3m2024/09/26
Read on Terminal Reader

For langt; At læse

Jeg er begyndt at lege med offentligt tilgængelige meningsmålingsdata for det amerikanske præsidentvalg i 2024. Jeg betragter kun meningsmålere af høj kvalitet, men uden at vægte deres meningsmålinger anderledes. Jeg fokuserer på de 7 svingstater, der skal afgøre valget. 2024 vil ligne meget mere 2020 og 2016 end noget andet valg før det.
featured image - Meningsmålingerne ser godt ud for Harris. Med 2016/20 afstemningsfejlen er hun i problemer lige nu
Maximilian Speicher HackerNoon profile picture
0-item

Så jeg er begyndt at lege med FiveThirtyEights offentligt tilgængelige afstemningsdata . Hvorfor? Fordi jeg bare er interesseret i afstemningen omkring det amerikanske præsidentvalg i 2024 og den statistiske side af tingene og spekulerede på, hvordan jeg ville konstruere min egen lille forudsigelse fra bunden. Så her er hvad jeg gjorde for første forsøg.


(Ansvarsfraskrivelse: Jeg er ikke en professionel dataforsker. At lege med data og udforske nogle ting er virkelig mit hovedfokus.)


Først og fremmest vil jeg holde det enkelt for nu. Som Kahneman forklarer i sin bog, Noise : Simple modeller får ofte arbejdet gjort ret godt.


Derfor betragter jeg kun meningsmålere af høj kvalitet, men uden at veje deres meningsmålinger anderledes. Jeg inkluderer kun datapunkter med en numeric_grade ≥2,5 (bedst: 3) i 538's datasæt.


Det, jeg vægter, er nærhed til valgdagen. Jo tættere på 5. november, jo mere relevant er afstemningen. Jeg betragter meningsmålinger fra op til 90 dage (~3 måneder) før, vægtet lineært. En afstemning, der slutter den 7. august, har en vægt på 1/90, og en afstemning, der slutter den 4. november, er en på 90/90.


Endelig ser jeg ikke på nationale meningsmålinger. Det, jeg fokuserer på, er de 7 svingstater, der skal afgøre valget.


Med alt dette kommer vi frem til følgende billede pr. 24. september. Harris foran i MI, NV, NC, PA, WI; Trump i AZ & GA.



Baseret på disse sandsynligheder kan vi også beregne de forventede valgmandsstemmer (EV'er) for hver svingstat og løbet generelt:



Dette tager dog ikke højde for afstemningsfejl, som var signifikant i både 2016 og 2020. Så jeg gjorde også ①–③ for disse to. Jeg overvejer ikke valg før det, for lige siden Trump trådte ind på scenen, har valgdynamikken ændret sig markant. Gamle regler gælder ikke længere. 2024 vil ligne meget mere 2020 og 2016 end noget andet valg før det. Afstemningsfejlen for min metode ser sådan ud:



Efter "keep it simple"-reglen, lad os antage, at afstemningsfejlen i 2024 vil være gennemsnittet af 2016/20 og anvende den på marginerne fra oven, og også tilføje usikkerheden for afstemningsfejlen til usikkerheden fra meningsmålingerne:



Og igen, disse er de forventede elbiler baseret på sandsynligheden:



Nu kan man argumentere for, at meningsmålere måske har lært deres lektie, og afstemningen vil blive mere præcis igen i år. Dette var dog allerede et argument i 2020. Plus, i det mindste en del af problemet synes at være, at visse Trump-tilhængere simpelthen ikke ønsker at deltage i meningsmålinger længere på grund af tillidsproblemer (se f.eks. https://www.cnbc.com/2024/05/04/why-election-polls-were-wrong-in-2016-and-2020-and-whats-changing.html ).


Det er klart, at meningsmålingerne forsøger at lære og justere, men om de bliver mindre i år end ved de to tidligere valg, får vi først at se den 5. november. Foreløbig tager jeg heller ikke afstemningsfejl fra 2022 valg i betragtning. Jeg skal først læse mere om dette, og jeg går ud fra, at et præsidentvalg minder mest om andre præsidentvalg.


Så til dette første forsøg inkluderer min egen lille prognose en forudsigelse, der udelukkende er baseret på vægtede meningsmålinger fra meningsmålinger af høj kvalitet, og en forudsigelse, der antager, at 2024-afstemningsfejlen vil være gennemsnittet af 2016 og 2020.


Du er velkommen til at gå over til min Github – hvor jeg samler og arkiverer alt – og se de komplette data og beregninger i den seneste Excel-fil: https://github.com/maxspeicher/2024-us-presidential -valg/