Wprowadzenie
Celem tego projektu modelowania było przewidzenie wyniku wyborów w 2024 r. przy użyciu danych dotyczących zdrowia publicznego, danych demograficznych i danych historycznych. To unikalne podejście opiera się na predyktorach, które są wskaźnikiem poparcia społecznego dla Partii Demokratycznej w populacji. W USA stoimy przed wyborem binarnym: Demokrata lub Republikanin, a nasze wybory są rozstrzygane przez głosy elektorskie z każdego stanu. Dlatego przewidywany wskaźnik odpowiedzi był po prostu marginesem zwycięstwa w danym stanie.
Ze względu na Kolegium Elektorów, przewidywanie wyborów jest zasadniczo kwestią przewidywania garstki stanów. Większość stanów ma wiarygodną historię szerokiego marginesu zwycięstwa jednej lub drugiej partii, podczas gdy kilka nie. Dane i model będą dokładne w takim stopniu, w jakim dokładnie przewidują te stany. Ze względu na mniejszą wielkość próby ostatnich wyborów krajowych i znaczenie ostatnich punktów danych w modelu, nie będzie on w stanie wygenerować wysoce precyzyjnych prognoz dla stanów o wąskim marginesie zwycięstwa. Dlatego sukces tego modelu będzie zależał od jego zdolności do wykrycia, które stany wahające się mogą mieć większe poparcie dla Demokratów (lub Republikanów) niż to, co jest obecnie wykrywane w sondażach.
Tło i założenia
W ciągu ostatnich dwóch cykli wyborów prezydenckich widzieliśmy, jak publiczne sondaże zawiodły na wiele sposobów. W 2016 r. niemal wszystkie główne ośrodki sondażowe i media nie wykryły stopnia poparcia społecznego wśród Demokratów i Niezależnych, które doprowadziło do zwycięstwa Trumpa w kluczowych stanach wahających się i Rust Belt. W 2020 r. ośrodki sondażowe ponownie niedoceniły poparcia dla Trumpa w kluczowych stanach. Od tego czasu zaufanie do zdolności mediów do badania i docierania do prawdy uległo dalszej erozji.
Niniejsza analiza ma na celu znalezienie predyktorów, które odzwierciedlają dokładniejszy stan preferencji politycznych opinii publicznej, które nie podlegają słabościom stronniczości branży sondażowej. Ze względu na hiperpolaryzowaną naturę pandemii Covid-19 i wyraźnie widoczne linie, na których spadało poparcie dla szczepionki przeciwko Covid-19, publiczne przyjmowanie „nowej” wersji szczepionki przeciwko Covid-19 każdego roku jest silnie skorelowane z poparciem dla Partii Demokratycznej. Ponieważ co roku pojawia się nowa szczepionka przeciwko Covid-19, zakłada się, że ciągłe przyjmowanie wskazuje na lojalność wyborczą Demokratów. Inne wskaźniki, takie jak wskaźnik migracji krajowej i wnioski o głosowanie korespondencyjne, są silnie skorelowane z poparciem Demokratów w ciągu ostatnich czterech lat.
Ponadto dane dotyczące populacji ze źródeł zdrowia publicznego były wykorzystywane jako zmienne kontrolujące lub predykcyjne, w tym współczynnik śmiertelności, współczynnik urodzeń i zdrowie psychiczne. Niektóre dynamika demograficzna i populacji jest związana ze stanami o większym nastawieniu republikańskim, a inne ze stanami o nastawieniu demokratycznym, a te zależności utrzymywały się przez długi czas w niedawnej historii. Inne miary, takie jak wskaźnik migracji netto, mają silne powiązania, ale są one bardziej współczesne i zostały dotknięte pandemią Covid-19, podczas której wiele zamkniętych stanów niebieskich odnotowało stratę netto, a czerwone otwarte stany odnotowały zysk netto. Popularność corocznej szczepionki przeciwko Covid-19 maleje z roku na rok, a dane zostały dostosowane w celu zmierzenia względnej popularności, przy czym stany o wyższym ogólnym wskaźniku przyjmowania niż średnia odzwierciedlają wyższe poparcie dla Partii Demokratycznej.
Ogólnie rzecz biorąc, analiza ta ma na celu połączenie zarówno długoterminowych trendów, jak i nowszych trendów, aby oszacować obecny poziom poparcia dla Partii Demokratycznej. Ponieważ model musi być trenowany na danych udostępnianych wyłącznie w miesiącach (szczepienie przeciwko Covid-Vax) i tygodniach (wnioski o głosowanie korespondencyjne) poprzedzających wybory, nie będzie w stanie wykryć żadnych zmian w ostatniej chwili.
Jak powiedział George Box, „Wszystkie modele są błędne, ale niektóre są przydatne”. Mam nadzieję, że ta analiza może być przydatna do wykrywania sygnałów, które mogą nie być obecne w tradycyjnych sondażach wyborczych. Oprócz przewidywań (które są głównie dla zabawy), uwzględniłem pewne analizy stanów wahających się, które moim zdaniem mogą rzucić światło na kluczowe zmiany, które miały miejsce w ciągu ostatnich czterech lat.
Metody
Ponieważ wyjaśnialność i interpretacja są kluczowe w kontekście wyborów, trzymałem się prostych modeli. Uogólnione modele liniowe, regresja logistyczna i modele lasu losowego zostały wytrenowane na danych z lat 2020–2022. Wynik lub odpowiedź to margines zwycięstwa Partii Demokratycznej. W przypadku modelu logistycznego przewidywaną odpowiedzią była binarna wygrana lub przegrana dla danego stanu. Ponieważ każdy model ma swoje mocne i słabe strony, a także własne wskaźniki błędów, ostateczna klasyfikacja wygranej lub przegranej zostanie ustalona na podstawie większości głosów. Przesłałem swój kod i dane do GitHubi każdy może krytykować, poprawiać i przekazywać opinie.
Ograniczenia
Ze względu na moją decyzję o wykorzystaniu wskaźnika przyjmowania szczepionek przeciwko Covid-19 w stanach jako predyktora, ogranicza to oś czasu i dane, które można zebrać. Z tego powodu spodziewam się, że model będzie miał tendencję do faworyzowania Demokratów. Spośród 50 stanów pięć znalazło się w zakresie błędów. Wszystkie pięć z tych stanów jest uważane za stany wahadłowe. Na potrzeby kategoryzacji tylko stany, które wyraźnie wykraczają poza błędy moich modeli, zostaną sklasyfikowane jako wygrane dla tej partii. Te, które mieszczą się w zakresach błędów, zostaną sklasyfikowane jako toss-ups.
Dyskusja
Ponieważ w USA wybory są wyborem binarnym, analiza bierze pod uwagę tylko Demokratów kontra Republikanów i nie może wykryć zmian w poparciu dla kandydata wśród wyborców przeciwnej partii. Ujawnia to podstawowe założenie modelu, że wybory te nadal dotyczą przede wszystkim lojalności partyjnej, a nie indywidualnego kandydata.
W przypadku kandydatki Demokratów Kamali Harris uważam, że to założenie jest prawdziwe, ponieważ nie została wybrana w głosowaniu powszechnym w prawyborach, a większość kampanii polegała na stworzeniu strategicznie opracowanej persony kobiety, która do niedawna była w dużej mierze ignorowana, odrzucana, a nawet wyśmiewana. Widzimy, że w ciągu ostatnich kilku miesięcy debaty, próby zamachu i inne ważne momenty po prostu nie miały większego wpływu na trendy sondażowe.
W przypadku Donalda Trumpa nie sądzę, aby to założenie było prawdziwe. Znana persona Trumpa jest dominująca i wszechobecna. Z jego prezydentury w latach 2017–2021 i jego ciągłych zmagań z pozwami, próbami zabójstw i obsesją mediów, zwycięstwo Trumpa mówi o nim znacznie więcej niż o Partii Republikańskiej. Partia Demokratyczna to maszyna, a Partia Republikańska niechętnie umocniła poparcie dla Trumpa po latach walk wewnętrznych i podziałów wśród swoich liderów.
Ponieważ model wykorzystuje dane zarówno z wyborów prezydenckich w 2020 r., jak i wyborów do Senatu w 2022 r., jest on trenowany do modelowania poparcia dla partii, stąd jego wrodzona słabość. Ostatnie sondaże przesunęły się na korzyść Trumpa, ale główne stany wahające się są w remisie. Trzymając się moich metod i intencji tego ćwiczenia, żadne z tych danych nie zostały uwzględnione.
Analiza stanów wahadłowych
Wynik wyborów zostanie ustalony przez garść stanów. Obecnie bliskie wyścigi w Arizonie, Nevadzie, Wisconsin, Michigan, Karolinie Północnej, Georgii i Pensylwanii wystarczą, aby przechylić szalę wyborów na korzyść któregokolwiek z nich. Spośród tych stanów model sklasyfikował Michigan i Pensylwanię jako bezpiecznie przechylające Demokratów. Pozostałe stany znalazły się w zakresie błędu modelu, więc zostały sklasyfikowane jako toss-ups.
Aby zobrazować sposób działania tej analizy, poniżej zamieszczono kilka zestawień niektórych predyktorów dla stanów, które są zazwyczaj uważane za stany wahadłowe.
Wskaźniki migracji krajowych: 2019-2023*
Ogólnie rzecz biorąc, istnieje negatywna relacja między wskaźnikiem migracji netto a przewagą Demokratów. Przez ostatnie 4 lata wiele stanów niebieskich traciło ludzi, podczas gdy stany czerwone stany zyskały. W przypadku tych stanów wahania niektóre są „czerwone” w odniesieniu do gubernatorów i rządu stanowego, a inne są „niebieskie”. Ogólnie rzecz biorąc, Pensylwania i Michigan to jedyne 2 stany, które miały ujemne wskaźniki migracji w ciągu ostatnich 4 lat.
Wnioski o głosowanie korespondencyjne
Niektóre stany, takie jak Kalifornia, Kolorado i Nevada, są stanami „All Mail”. Oznacza to, że każdemu zarejestrowanemu wyborcy domyślnie wysyła się papierową kartę do głosowania. Z wyjątkiem Utah (i prawdopodobnie Nevady) prawie wszystkie te stany są stanami niebieskimi i są solidnie niebieskie. Nevada jest jedynym stanem wahającym się, który jest stanem całkowicie pocztowym, jak widać, jego wnioski pozostają na tym samym poziomie. Ogólny trend w większości innych stanów, z wyjątkiem Arizony, to spadek wniosków o głosowanie pocztowe.
Roczne szczepienie przeciwko COVID-19**
Ponieważ model wykorzystuje coroczne szczepienie przeciwko COVID-19 jako silny predyktor poparcia dla Partii Demokratycznej, ale ogólna popularność spada, model wykorzystuje względną punktację, aby porównać każdy stan ze sobą w ciągu roku. Oprócz Wisconsin, pozostałe stany miały nieco poniżej średniej liczbę szczepień przeciwko Covid-19 w 2021**, 2022 i 2024 r.
*Wskaźniki migracji krajowych są zgodne z danymi z poprzedniego roku.
**Ponieważ szczepionki przeciwko Covid-19 nie były dostępne do 2021 r., dane z 2021 r. zestawiono z danymi dotyczącymi wyników wyborów w 2020 r. Dane z 2022 r. i 2024 r. odzwierciedlają przyjęcie nowej wersji w danym roku.
Aby zrozumieć, jak ważne są predyktory dla modelu, poniższy wykres klasyfikuje każdą miarę pod względem tego, jak bardzo wpływa na jedną z prognoz modelu. Jak widać, liczba zaszczepionych przeciwko Covid-19 jest sklasyfikowana tuż pod „poprzednim zwycięstwem Demokratów”.
Efekt
Model zakłada, że Harris bezpiecznie wygra 260 głosów elektorskich w stanach, które według przewidywań będą bezpiecznie demokratyczne. Jeśli Pensylwania i Michigan faktycznie są w grze, to tylko 226 z nich jest bezpiecznie demokratycznych.
Model przewiduje, że Trump bezpiecznie zdobędzie 219 głosów elektorskich w stanach, które według przewidywań będą zdecydowanie republikańskie.
Wahające się stany Wisconsin, Georgia, Karolina Północna, Nevada i Arizona są do zdobycia i reprezentują 59 głosów elektorskich. Jeśli Pensylwania i Michigan są w grze, to jest 93 głosy elektorskie do zdobycia.
Droga Harrisa do zwycięstwa
Droga Harris do zwycięstwa wydaje się najłatwiejsza. Mając wyższy początkowy głos elektorski „w kieszeni”, może zebrać garść stanów wahających się. Pensylwania i Michigan są dla niej zwycięstwami w modelu, a jeśli je wygra, potrzebuje tylko jednego z Arizony, Karoliny Północnej, Wisconsin lub Georgii, aby je zapewnić. Jeśli wygra w jednym z Pensylwanii lub Michigan, musi zastąpić porażkę 1-2 dodatkowymi stanami wahającymi się.
Droga Trumpa do zwycięstwa
Ważne jest, aby patrzeć na ścieżkę Trumpa z nastawieniem „wszystko może się zdarzyć”. Przewyższył oczekiwania w obu poprzednich wyborach. Większość strażników informacji, głównych ekspertów i ankieterów wyborczych myliła się w przeszłości.
Mając 219 w kieszeni, Trump musi wygrać każdy losowy stan: Arizona, Georgia, Karolina Północna, Wisconsin i Nevada. Jeśli Trump wygra w Pensylwanii i/lub Michigan, jego droga stanie się łatwiejsza, co oznacza, że nadal będzie potrzebował 2-3 z pozostałych losowych.
Spójrz na poniższy panel. Wejdź w interakcję, aby zobaczyć, jak przebiega droga każdego z kandydatów do zwycięstwa, wygrywając w stanach losowych, i zobacz wykresy punktowe dla prognoz mierzonych według stanu.
Moje osobiste przewidywania na podstawie modelu
Mam więcej intuicji co do Karoliny Północnej i Georgii, ponieważ spędziłem tam trochę czasu, i obstawiam je dla Trumpa. Nie mam takiej intuicji co do Arizony, Nevady ani Wisconsin. Więc traktuj to z przymrużeniem oka. Ale będąc wiernym metodzie, mój model obstawia Pensylwanię i Michigan dla Harris i wierzę, że zdobędzie co najmniej 2-3 dodatkowe stany wahania. Mam nadzieję, że się mylę.
Referencje:
Laboratorium Wyborcze MIT https://electionlab.mit.edu/data#data
Fakty z USA https://usafacts.org/economy/
Laboratorium Wyborcze UF https://election.lab.ufl.edu/voter-turnout/
Głosowanie i rejestracja w wyborach w listopadzie 2022 r. https://www.census.gov/data/tables/time-series/demo/voting-and-registration/p20-586.html
CDC https://data.cdc.gov/NCHS/Indicators-of-Anxiety-or-Depression-Based-on-Repor/8pt5-q6wp/about_data
CMS https://data.cms.gov/provider-data/dataset/avax-cv19
CDC https://www.cdc.gov/covidvaxview/weekly-dashboard/vaccine-administration-coverage-jurisdiction.html
piąta trzydzieści osiem https://github.com/fivethirtyeight/election-results/blob/main/election_results_senate.csv
Monitor szczepień KFF https://www.kff.org/coronavirus-covid-19/dashboard/kff-covid-19-vaccine-monitor-dashboard/
Laboratorium Wyborcze UF https://election.lab.ufl.edu/2024-presidential-nomination-contests-turnout-rates/
Narodowe Centrum Statystyki Zdrowia https://www.cdc.gov/nchs/data_access/VitalStatsOnline.htm CDC https://www.cdc.gov/nchs/data/vsrr/vsrr035.pdf Spis powszechny.Gov https://www.census.gov/data/tables/time-series/demo/popest/2020s-state-total.htmlCDC https://www.cdc.gov/covidvaxview/interactive/adults.html
Narodowe Centrum Statystyki Zdrowia https://www.cdc.gov/nchs/fastats/state-and-territorial-data.htm
Spis powszechny – ubóstwo https://www.census.gov/data/tables/time-series/demo/income-poverty/historical-poverty-people.html
Spis powszechny – zmiana populacji według stanu https://www.census.gov/newsroom/press-kits/2023/national-state-population-estimates.html
Projekt wyborów w USA https://electproject.github.io/
Opublikowane ponownie od autora Zastępki
Opublikowane pod a Creative Commons Uznanie autorstwa 4.0 Licencja międzynarodowa
W przypadku przedruków ustaw link kanoniczny z powrotem na oryginał Instytut Brownstone Artykuł i autor.