WYKORZYSTANIE MATEMATYKI DO ZBADANIA WYNIKÓW WYBORÓW W IRANIE | NAUKA | SMITHSONIAN - ARTYKUŁY, BLOGI, ZASKAKUJĄCA NAUKA, NAUKA, LUDZKIE ZACHOWANIE

Statystycy i politolodzy mają dzień polowy z wynikami wyborów w Iranie na początku tego miesiąca. Czy wybory zostały sfałszowane? Być może nigdy się nie dowiemy, ale matematyka jest wystarczająco pochowana, abyśmy myśleli, że tak mogło być. Jednak nawet wtedy jest wystarczająco dużo, abyśmy uwierzyli, że wszystko jest legalne. Oto kilka analiz, które uznałem za szczególnie interesujące:

Wyczyść dane

Bezpośrednio po wyborach pojawiły się wątpliwości co do legalności danych, ponieważ za każdym razem, gdy wydawana była nowa partia wyników głosowania (ujawniają się one w Iranie, podobnie jak w Stanach Zjednoczonych), procent głosów oddanych na prezydenta Mahmuda Ahmadineżada było to samo: 67 procent. Dane zwykle nie są czyste, a niektórzy zaczęli się zastanawiać, czy wyniki zostały sfabrykowane.

Analiza przeprowadzona przez profesora matematyki z Uniwersytetu Wisconsin, Jordana Ellenberga w Slate, jednak zagłębia się w dane, aby wykazać, że było to bardziej bałagan niż można się było spodziewać. Wyniki nie wychodziły z miasta po mieście, ale w dużych partiach, które łączyły dane z kilku obszarów, co oznaczało, że sumy głosów Ahmadineżada były naprawdę średnimi. A prawo wielkich liczb dyktuje, jak napisał Ellenberg:

Średnie bardzo różne ilości mogą i zwykle dają wyniki, które wyglądają prawie idealnie jednolicie. Biorąc pod uwagę wystarczającą ilość danych, wartości odstające mają tendencję do wzajemnego znoszenia się.

Ellenberg konkluduje, że dane są „zdecydowanie nieporządne, aby mogły być prawdziwe”.

Prawo Benforda

W kilku analizach przeanalizowano pierwsze cyfry wyników wyborów w Iranie, aby sprawdzić, czy są one zgodne z prawem Benforda, czyli:

Na listach liczb z wielu (ale nie wszystkich) rzeczywistych źródeł danych cyfra wiodąca jest dystrybuowana w określony, nierównomierny sposób. Zgodnie z tym prawem pierwsza cyfra to 1 prawie jedna trzecia czasu, a większe cyfry występują jako cyfra wiodąca o coraz niższej częstotliwości, do momentu, w którym 9 jako pierwsza cyfra występuje rzadziej niż raz na dwadzieścia. Ten rozkład pierwszych cyfr powstaje logicznie, ilekroć zbiór wartości jest dystrybuowany logarytmicznie.

W jednej analizie wykorzystującej tę metodę Boudewijn Roukema z Uniwersytetu Mikołaja Kopernika w Polsce stwierdzono, że liczba głosów liczonych od cyfry 7 dla Mehdiego Karroubiego jest prawie dwukrotnie większa niż można by oczekiwać w prawie Benforda. Ponadto Roukema podejrzewał, że wyniki dla Ahmadineżada, w których było mniej 1 i więcej 2 i 3 niż oczekiwano, byłyby prawdopodobne, gdyby ktoś postanowił zmanipulować wyniki poprzez zmianę 1 na początku głosowania na 2 i 3s. Doprowadziłoby to również do przeszacowania sum Ahmadineżada o kilka milionów głosów.

Walter Mebane, politolog i statystyk z University of Michigan, również wykorzystał prawo Benforda w swojej analizie, w której stwierdza również kilka nieprawidłowości w wynikach wyborów w Iranie. Ale nawet on przyznaje, że chociaż jego wyniki są „zgodne z powszechnym oszustwem”, są one również „zgodne z faktycznym zwycięstwem Ahmadineżada”.

Dwie ostatnie cyfry

Dwóch absolwentów nauk politycznych na Columbia University wzięło jeszcze trzecie podejście do tych danych. W analizie, którą podsumowali w komentarzu do Washington Post, zbadali dwie ostatnie cyfry liczenia głosów z 29 prowincji dla każdego z czterech kandydatów (np. Jeśli ktoś otrzymał 14 579 głosów, tylko 7 i 9 były brane pod uwagę w analiza).

Dwie ostatnie cyfry w wynikach wyborów to losowy szum, a rozkład cyfr powinien być dość równy - każda cyfra powinna pojawiać się w około 10 procentach przypadków. Ludzie są jednak słabymi generatorami liczb losowych i kiedy tworzymy liczby, zwykle wybieramy niektóre liczby częściej niż inne. W wynikach Iranu tylko 4 procent liczb kończy się cyfrą 5, podczas gdy cyfra 7 pojawia się w 17 procentach przypadków. Wyniki, które tak bardzo odbiegają od normy, można się spodziewać w około czterech na 100 wyborów.

Ludzie mają również problemy z tworzeniem liczb, które nie przylegają do siebie cyfr (tj. Rzadziej wymyślą 72, niż 23), ale liczby te powinny również odpowiadać losowym wzorom, a około 70 procent par powinno składać się z niesąsiadujących cyfry Jednak w wynikach Iranu robi to tylko 62 procent. Ponownie, wyników tych można się spodziewać w około 4 na 100 wyborów. Ale kombinacji tych dwóch wyników można się spodziewać tylko w 1 na każde 200 wyborów. Być może nieprawdopodobne, ale nie niemożliwe.

Gdzie nas to opuszcza? Możemy nigdy nie wiedzieć, czy zgłaszane wyniki są prawdziwe, czy nie. Jednak mój ulubiony kawałek danych z tego wszystkiego nie wymaga żadnych obliczeń, które mogłyby prowadzić do pytań o zasadność wyborów. Cytat ten, autorstwa Abbasa-Ali Kadkhodaei, rzecznika irańskiej Rady Strażników, sprawiłby, że prawie każdy pomyślałby dwa razy:

Statystyki przedstawione przez Mohsena Resaei, w których twierdzi, że ponad 100% uprawnionych do głosowania oddało głos w 170 miastach, nie są dokładne - incydent miał miejsce tylko w 50 miastach.

(Aby uzyskać więcej informacji na temat analiz wyników wyborów w Iranie, sprawdź Nate Silver na fivethirtyeight.com)