Pusztán a matekból nem jön ki, hogy csaltak volna az amerikai elnökválasztáson

2020.11.09. 07:16

Akik a gyanús számeloszlásokkal magyarázzák, hogy Biden csalt volna, azok nem veszik figyelembe, hogy különböző méretűek a szavazókörzetek és ezekben különböző, sokszor extrém arányban nyert a jelölt.

Ez itt egy véleménycikk, ami nem feltétlenül tükrözi az Azonnali álláspontját, de itt van, mert szeretjük a jól érvelő és érdekes szövegeket. Ha vitáznál vele, vagy küldenél egyet te is, csak bátran!

A Reaktor portálon jelent meg egy cikk – melyet több lap is átvett – arról, hogy statisztikai módszerekkel kimutathatóan csalás történt néhány városban és megyében az amerikai elnökválasztáson. A szerző a Benford-törvény alapján vizsgálja az egyes megyei, városi szavazási eredményeket.

Mégis mi ez a törvény, és hogyan segít leleplezni a csalást?

Benford törvénye azon a megfigyelésen alapul, hogy ha veszünk egy nagy számhalmazt, ami véletlenszerű számokat tartalmaz – lehet ez az európai patakok hossza, a magyar települések lélekszáma vagy éppen a brit költségvetés sorainak számai –, az ebben a halmazban lévő minden egyes szám első számjegyét alapul véve nem egyenletes eloszlást fogunk találni. Hanem sokkal több lesz a kisebb számmal kezdődő szám, mint a 8-assal vagy 9-essel kezdődő. Benford törvénye szerint a számok kb. 31 százaléka kezdődik 1-gyel, 19 százaléka 2-vel, 12 százaléka 3-mal, és a százalékok a számok nagyságával egyre csökkennek.

Ez a felismerés

lehetővé teszi, hogy nagy mennyiségű számadatban ellenőrizzük, hogy átírták-e a számokat, azaz történt-e tömeges adathamisítás. Ugyanis a hamisítók véletlenszerű számokat próbálnak generálni,

melyek első számjegye ugyanolyan valószínűséggel lesz 9-es, mint 3-as, 7-es vagy 1-es, és ez sérti a Benford-eloszlást. Német közgazdászok utólag bebizonyították, hogy a görög gazdasági statisztikák hamisítását a Benford-eloszlás ellenőrzésével már jóval korábban, az eurózóna-csatlakozásuk előtt le lehetett volna leplezni.

Benford törvénye jól használható, ha kellőképpen sok elemből áll az adathalmaz, és a benne található számok sokféle nagyságrendben előfordulnak, például ugyanúgy van benne nagyszámú 1-100 közötti, 100-1000 közötti vagy 1000-10000 közötti szám.

Mit jelent ez az amerikai elnökválasztáson leadott szavazatok esetén?

A Reaktor-cikk állítása szerint, ha egy jelöltre leadott szavazatok száma nem követi a Benford-eloszlást, akkor csalásra gyanakodhatunk. Ez alapján az egyes körzetekben a jelöltekre leadott szavazatok számának első számjegyét véve az 1-esnek kellene a leggyakrabban, a 2-esnek a második leggyakrabban előfordulnia, és a számok növekedésével gyakoriságuknak egyre csökkennie kell. Ha nem így van, az adathalmaz sérti Benford törvényét, így lehet, hogy átírták a számokat. 

ÍGY NÉZ KI EGY SZÉP BENFORD-ELOSZLÁS A GYAKORLATBAN. ADATOK FORRÁSA: FULTON COUNTY

Ez azt mutatja, hogy összesen 121 szavazókörzet volt, ahol Trumpra egyezres, egyszázas nagyságrendben vagy 10 és 19 között érkezett szavazat, illetve mindösszesen 21 olyan körzet volt, ahol a szavazatok száma 9-cel kezdődött – vagy azért, mert mondjuk csak 9 vagy kilencvenvalahány ember szavazott rá, vagy azért, mert kifejezetten sok, 900-999 közötti szavazat érkezett az elnökre. Itt Biden görbéje is követi a Benford-eloszlást.

Több olyan példát is mutat a Reaktor cikke, ahol bizony Biden szavazatainak eloszlása jelentősen eltér a Benford-törvény szerint vártaktól. A legextrémebb példa Chicago.

CHICAGO A BENFORD-ELOSZLÁS SZEMPONTJÁBÓL EXTRÉMEN NÉZ KI. ADATOK FORRÁSA: BOARD OF ELECTION COMMISSIONERS, CHICAGO

Látható, hogy Trump szavazatainak görbéje nagyjából követi a Benford-eloszlást, Bidennél viszont a 3-mal kezdődő körzet-szavazatszámok jóval gyakoribbak, mint az 1-gyel vagy 2-vel kezdődők, vagyis több körzetben szavaztak rá háromszáz-valamennyien vagy háromezer-valamennyien, mint egy-, illetve kétszáz-valamennyien vagy ezer- vagy kétezer-valamennyien. Ennek alapján felmerül a választási csalás gyanúja a cikk szerint.

A logika azonban több ponton is sántít

A Reaktor-cikk szerzője azonban nem vett figyelembe több, lényeges tényezőt.

Először is, a szavazókörzetenkénti Benford-eloszlás vizsgálatakor abszolút meghatározó a szavazókörzetek nagysága, azaz, hogy hány regisztrált szavazó van a körzetekben. Egy nagyon leegyszerűsített példával élve, ha minden választókörzetben mondjuk 1000 választójogú lakos lenne, és ebből körzetenként 500-700 fegyelmezetten regisztrál, akkor körzetenként a regisztráltaknál az 5-ös, 6-os, 7-es első számjegyek fognak dominálni, még az elő is megtörténhet, hogy egy darab 1-essel vagy 2-essel kezdődő sem fordul elő.

Ehhez hasonlóan: ha a körzetek szavazólétszáma nem éri el az 1000-es átlagot, hanem mondjuk 700 körüli, mint Chicago esetében, akkor a regisztrált szavazók száma sem fogja követni a Benford-eloszlást.

Másrészt Joe Biden Chicagóban megszerezte a szavazatok 82 százalékát, ezzel szavazatainak Benford-eloszlása nagyjából le fogja követni az összes leadott érvényes szavazat eloszlását, hiszen óriási fölénnyel nyert.

A MAGYARÁZAT: VISZONYLAG KICSIK A KÖRZETEK ÉS BIDEN NAGYON NYERT. ADATOK FORRÁSA: BOARD OF ELECTION COMMISSIONERS, CHICAGO

A regisztrált szavazók száma a 6-osnál ér csúcsot, ez egyenesen következik a regisztrált szavazók számából, ami Chicagóban átlagosan 754 fő volt szavazókörzetenként. A regisztrált szavazók görbéjének mintázatát követi a kisebb számok felé eltolva a leadott, illetve az érvényes szavazatok száma (nyilván kevesebben szavaztak, mint ahányan regisztráltak), majd Biden szavazatainak száma. A kevés, 16 százalékot szerzett Trump szavazatainak eloszlási görbéjét ez a választókörzeti nagyságból eredő torzítás nem befolyásolja.

Ez a mintázat máshol is ismétlődik, például Alleghenyben, Pennsylvaniában, ahol a szavazókörzet-méret mediánja 648 fő.

ITT SZINTÉN KICSIK A KÖRZETEK, DE BIDEN NEM NYERT ANNYIRA NAGYON. ADATOK FORRÁSA: ALLEGHENY COUNTY

Itt Biden kevesebbel, 59 százalékkal nyert, és ezért az eloszlási görbéje kisebb számnál, a 2-esnél tetőzik, de még mindig jóval több a 2-es, mint az 1-es.

A Reaktor-cikkben a Benford-törvényt rendesen követő példaként szerepel Miami-Dade megye. Azonban ha megnézzük a szavazókörzetek nagyságát, láthatjuk, hogy itt viszont a regisztrált szavazók száma fog „rendetlenkedni”.

A KETTES MINDENT VISZ. ADATOK FORRÁSA: MIAMI DADE COUNTY

Ennek nagyon egyszerű oka az, hogy ebben a megyében a szavazókörzetekben regisztrált szavazók átlagos száma 2026 fő, a 2000-2999 fős körzetek száma meghaladta az 1000-1999 fős körzetek számát, emiatt a kettes „mindent visz”.

Mindezek miatt a Benford-törvény szerinti eloszlással óvatosan kell bánni a választások tisztaságának vizsgálatánál, és kicsit jobban a mélyére kell nézni az adatoknak.

Ha megfelelő adathalmazra alkalmazzuk a Benford-törvényt, akkor az valóban alkalmas a tömeges adathamisítás kiszűrésére. Nagyon sok számot egyenletes eloszlásban tartalmazó adathalmazok elemzésére, például országok költségvetési adatainak, cégek könyvelési adatainak ellenőrzésére kiválóan alkalmas a Benford-eloszlás vizsgálata, de ha az adataink nagysága és eloszlása mesterségesen korlátozott, mint ebben az esetben, ahol a választókörzetek lélekszáma sokszor 1000 fő alatti, akkor a módszer téves riasztásokat fog adni csalásokról.

A szerző közgazdász. Hozzászólnál? Vitatkoznál? Írj nekünk!

Tetszett a cikk?

Az Azonnali hírlevele

Nem linkgyűjtemény. Olvasmány. A Reggeli fekete hétfőn, szerdán és pénteken jön, még reggel hét előtt – tíz baristából kilenc ezt ajánlja a kávéhoz!

Feliratkozásoddal elfogadod az adatkezelési szabályzatot.

Kommentek