+++ Kérj egy Reggeli feketét! Heti háromszor küldjük neked. Nem linkgyűjtemény: olvasmány. +++
Karsánszky Ferenc
2020. november 9. hétfő, 07:16
Akik a gyanús számeloszlásokkal magyarázzák, hogy Biden csalt volna, azok nem veszik figyelembe, hogy különböző méretűek a szavazókörzetek és ezekben különböző, sokszor extrém arányban nyert a jelölt.

Ez itt egy véleménycikk, ami nem feltétlenül tükrözi az Azonnali álláspontját, de itt van, mert szeretjük a jól érvelő és érdekes szövegeket. Ha vitáznál vele, vagy küldenél egyet te is, csak bátran!

 

A Reaktor portálon jelent meg egy cikk – melyet több lap is átvett – arról, hogy statisztikai módszerekkel kimutathatóan csalás történt néhány városban és megyében az amerikai elnökválasztáson. A szerző a Benford-törvény alapján vizsgálja az egyes megyei, városi szavazási eredményeket.

 

Mégis mi ez a törvény, és hogyan segít leleplezni a csalást?

 

Benford törvénye azon a megfigyelésen alapul, hogy ha veszünk egy nagy számhalmazt, ami véletlenszerű számokat tartalmaz – lehet ez az európai patakok hossza, a magyar települések lélekszáma vagy éppen a brit költségvetés sorainak számai –, az ebben a halmazban lévő minden egyes szám első számjegyét alapul véve nem egyenletes eloszlást fogunk találni. Hanem sokkal több lesz a kisebb számmal kezdődő szám, mint a 8-assal vagy 9-essel kezdődő. Benford törvénye szerint a számok kb. 31 százaléka kezdődik 1-gyel, 19 százaléka 2-vel, 12 százaléka 3-mal, és a százalékok a számok nagyságával egyre csökkennek.

 

Ez a felismerés

 

lehetővé teszi, hogy nagy mennyiségű számadatban ellenőrizzük, hogy átírták-e a számokat, azaz történt-e tömeges adathamisítás. Ugyanis a hamisítók véletlenszerű számokat próbálnak generálni,

 

melyek első számjegye ugyanolyan valószínűséggel lesz 9-es, mint 3-as, 7-es vagy 1-es, és ez sérti a Benford-eloszlást. Német közgazdászok utólag bebizonyították, hogy a görög gazdasági statisztikák hamisítását a Benford-eloszlás ellenőrzésével már jóval korábban, az eurózóna-csatlakozásuk előtt le lehetett volna leplezni.

 

Benford törvénye jól használható, ha kellőképpen sok elemből áll az adathalmaz, és a benne található számok sokféle nagyságrendben előfordulnak, például ugyanúgy van benne nagyszámú 1-100 közötti, 100-1000 közötti vagy 1000-10000 közötti szám.

 

Mit jelent ez az amerikai elnökválasztáson leadott szavazatok esetén?

 

A Reaktor-cikk állítása szerint, ha egy jelöltre leadott szavazatok száma nem követi a Benford-eloszlást, akkor csalásra gyanakodhatunk. Ez alapján az egyes körzetekben a jelöltekre leadott szavazatok számának első számjegyét véve az 1-esnek kellene a leggyakrabban, a 2-esnek a második leggyakrabban előfordulnia, és a számok növekedésével gyakoriságuknak egyre csökkennie kell. Ha nem így van, az adathalmaz sérti Benford törvényét, így lehet, hogy átírták a számokat. 

 

ÍGY NÉZ KI EGY SZÉP BENFORD-ELOSZLÁS A GYAKORLATBAN. ADATOK FORRÁSA: FULTON COUNTY

 

Ez azt mutatja, hogy összesen 121 szavazókörzet volt, ahol Trumpra egyezres, egyszázas nagyságrendben vagy 10 és 19 között érkezett szavazat, illetve mindösszesen 21 olyan körzet volt, ahol a szavazatok száma 9-cel kezdődött – vagy azért, mert mondjuk csak 9 vagy kilencvenvalahány ember szavazott rá, vagy azért, mert kifejezetten sok, 900-999 közötti szavazat érkezett az elnökre. Itt Biden görbéje is követi a Benford-eloszlást.

 

Több olyan példát is mutat a Reaktor cikke, ahol bizony Biden szavazatainak eloszlása jelentősen eltér a Benford-törvény szerint vártaktól. A legextrémebb példa Chicago.

 

CHICAGO A BENFORD-ELOSZLÁS SZEMPONTJÁBÓL EXTRÉMEN NÉZ KI. ADATOK FORRÁSA: BOARD OF ELECTION COMMISSIONERS, CHICAGO

 

Látható, hogy Trump szavazatainak görbéje nagyjából követi a Benford-eloszlást, Bidennél viszont a 3-mal kezdődő körzet-szavazatszámok jóval gyakoribbak, mint az 1-gyel vagy 2-vel kezdődők, vagyis több körzetben szavaztak rá háromszáz-valamennyien vagy háromezer-valamennyien, mint egy-, illetve kétszáz-valamennyien vagy ezer- vagy kétezer-valamennyien. Ennek alapján felmerül a választási csalás gyanúja a cikk szerint.

 

A logika azonban több ponton is sántít

 

A Reaktor-cikk szerzője azonban nem vett figyelembe több, lényeges tényezőt.

 

Először is, a szavazókörzetenkénti Benford-eloszlás vizsgálatakor abszolút meghatározó a szavazókörzetek nagysága, azaz, hogy hány regisztrált szavazó van a körzetekben. Egy nagyon leegyszerűsített példával élve, ha minden választókörzetben mondjuk 1000 választójogú lakos lenne, és ebből körzetenként 500-700 fegyelmezetten regisztrál, akkor körzetenként a regisztráltaknál az 5-ös, 6-os, 7-es első számjegyek fognak dominálni, még az elő is megtörténhet, hogy egy darab 1-essel vagy 2-essel kezdődő sem fordul elő.

 

Ehhez hasonlóan: ha a körzetek szavazólétszáma nem éri el az 1000-es átlagot, hanem mondjuk 700 körüli, mint Chicago esetében, akkor a regisztrált szavazók száma sem fogja követni a Benford-eloszlást.

 

Másrészt Joe Biden Chicagóban megszerezte a szavazatok 82 százalékát, ezzel szavazatainak Benford-eloszlása nagyjából le fogja követni az összes leadott érvényes szavazat eloszlását, hiszen óriási fölénnyel nyert.

 

A MAGYARÁZAT: VISZONYLAG KICSIK A KÖRZETEK ÉS BIDEN NAGYON NYERT. ADATOK FORRÁSA: BOARD OF ELECTION COMMISSIONERS, CHICAGO

 

A regisztrált szavazók száma a 6-osnál ér csúcsot, ez egyenesen következik a regisztrált szavazók számából, ami Chicagóban átlagosan 754 fő volt szavazókörzetenként. A regisztrált szavazók görbéjének mintázatát követi a kisebb számok felé eltolva a leadott, illetve az érvényes szavazatok száma (nyilván kevesebben szavaztak, mint ahányan regisztráltak), majd Biden szavazatainak száma. A kevés, 16 százalékot szerzett Trump szavazatainak eloszlási görbéjét ez a választókörzeti nagyságból eredő torzítás nem befolyásolja.

 

Ez a mintázat máshol is ismétlődik, például Alleghenyben, Pennsylvaniában, ahol a szavazókörzet-méret mediánja 648 fő.

 

 

ITT SZINTÉN KICSIK A KÖRZETEK, DE BIDEN NEM NYERT ANNYIRA NAGYON. ADATOK FORRÁSA: ALLEGHENY COUNTY

 

Itt Biden kevesebbel, 59 százalékkal nyert, és ezért az eloszlási görbéje kisebb számnál, a 2-esnél tetőzik, de még mindig jóval több a 2-es, mint az 1-es.

 

A Reaktor-cikkben a Benford-törvényt rendesen követő példaként szerepel Miami-Dade megye. Azonban ha megnézzük a szavazókörzetek nagyságát, láthatjuk, hogy itt viszont a regisztrált szavazók száma fog „rendetlenkedni”.

 

A KETTES MINDENT VISZ. ADATOK FORRÁSA: MIAMI DADE COUNTY

 

Ennek nagyon egyszerű oka az, hogy ebben a megyében a szavazókörzetekben regisztrált szavazók átlagos száma 2026 fő, a 2000-2999 fős körzetek száma meghaladta az 1000-1999 fős körzetek számát, emiatt a kettes „mindent visz”.

 

Mindezek miatt a Benford-törvény szerinti eloszlással óvatosan kell bánni a választások tisztaságának vizsgálatánál, és kicsit jobban a mélyére kell nézni az adatoknak.

 

Ha megfelelő adathalmazra alkalmazzuk a Benford-törvényt, akkor az valóban alkalmas a tömeges adathamisítás kiszűrésére. Nagyon sok számot egyenletes eloszlásban tartalmazó adathalmazok elemzésére, például országok költségvetési adatainak, cégek könyvelési adatainak ellenőrzésére kiválóan alkalmas a Benford-eloszlás vizsgálata, de ha az adataink nagysága és eloszlása mesterségesen korlátozott, mint ebben az esetben, ahol a választókörzetek lélekszáma sokszor 1000 fő alatti, akkor a módszer téves riasztásokat fog adni csalásokról.

 

A szerző közgazdász. Hozzászólnál? Vitatkoznál? Írj nekünk!

 

comments powered by Disqus
Hírszolgáltatás

Zágrábban az antifasizmus napján ismét fellángolt a vita, hogy nevezzék-e vissza a Nemzeti Színház előtti teret Titóra. De nem fogják.

A logójukat adják-e csak, vagy aktivistákat is? Körbekérdeztük az ellenzéki összefogás pártjait.

Az Apple Daily volt a legnagyobb és a legtovább fennálló hongkongi print bulvárnapilapot és online hírportált is üzemeltető médium, ami a kínai rezsimnek nem kellemes dolgokról is beszámolt.

A koronavírus-járvány miatt egy évvel elcsúsztatott olimpiát anno még úgy reklámozták, hogy az a világjárvány feletti győzelem bizonyítéka lesz.

Pénzzel, de volt, hogy néha tejtermékekkel fizettek le rendőröket Romániában.

1941. június 22-én éjjel negyed négykor kezdetét vette a Barbarossa-hadművelet, melynek célja a Szovjetunió lerohanása és térdre kényszerítése volt.

Věra Jourová szerint például ha valakinek baja van a szivárványszínnel, az róla mond el sokat, a bajor Markus Söder szerint meg ez a büszke útja annak, hogy a társadalom szabadságáért szóljunk fel.

A hét kérdése

Magyarország hiába szerepelt eddig jól az Eb-n, mivel a legnehezebb csoportba került, így az esélyek egyáltalán nem nekünk kedveznek. Ennek ellenére matematikailag van esélyünk, hogy továbbjussunk. Szerinted sikerülni fog?

Azért ide elnéznénk

A magyar hiphop Álmos vezére és a feltörekvő rapcsillag együtt szántják fel Kőbányát július 3-án szombaton.

Kiállítás Budapesten Fiuméről és a magyar kereskedelmi tengerészet történetéről, egészen október 31-ig.

Gyere az Azonnali olvasói Facebook-csoportjába kibeszélni mindent!

Ezt is szerettétek

Miben más az olajlobbi 2021-ben, mint amit a hollywoodi filmek alapján elképzelünk? Hidi Jánossal beszélgettünk.

Az OMOH évek óta fix igazodási pont a magyar LMBTQ-bulizók körében, indulásuk óta vállaltan az LMBTQ-közösséghez szólnak. Marton Péter DJ-vel beszélgettünk. Podcast!

Buktatható-e Lukasenka titkosszolgálati eszközökkel, és ha igen, ki tehetné ezt meg? Miért nem annektálta még Belaruszt Oroszország?

A Helyzetben vele beszélgettünk arról, miért nincs több nő a magyar rapben, mit gondol a motyogós rappről, és hogyan alkotott a lockdown idején.

Hogyan lett egy csepeli utcagyerekből a Blade Runner 2049, az Atomic Blonde, vagy a Hellboy 2 utcaképeinek az elkövetője? Mit gondol ma az egykori legendás graffitis a régi házak falainak összefirkálásáról? Podcast!

Meddig adminisztratív hiba az állam részéről, ha nem küldi valakinek az igazolásokat, és honnan súlyosabb mulasztás?

Manek Gábor számos budapesti étterem tulajdonosaként is építi a fővárosi gasztronómiát. Vele beszélgettünk az éttermek újranyitásáról, a Lärm jövőjéről, valamint a nyári fesztiváltervekről. Podcast!

Twitter megosztás Google+ megosztás