https://frosthead.com

Świat Według Twittera w Mapach

Tweety z całego świata, wykreślone według lokalizacji w ramach nowego badania. Kliknij, aby powiększyć. Zdjęcie przez pierwszy poniedziałek / Leetaru i in. glin.

Trudno docenić to, jak szybko i dokładnie Twitter zdobył świat. Zaledwie siedem lat temu, w 2006 roku, był to pomysł nakreślony na kartce papieru. Obecnie z tej usługi korzysta około 554 milionów użytkowników - liczba ta stanowi prawie 8 procent wszystkich ludzi na planecie - i wysłano około 170 miliardów tweetów, a liczba ta rośnie każdego dnia o około 58 milionów .

Wszystkie te tweety stanowią nieocenione źródło wiadomości, rozrywki, rozmów i kontaktów między ludźmi. Ale dla naukowców są one również cenne jako coś raczej innego: surowe dane.

Ponieważ Twitter oferuje otwarty interfejs API (który umożliwia pobieranie tweetów jako nieprzetworzonych, analizowalnych danych), a wiele tweetów jest oznaczonych geotagami, badacze mogą wykorzystać miliardy tych tweetów i przeanalizować je według lokalizacji, aby dowiedzieć się więcej o geografii ludzi na całej planecie. Zeszłej jesieni, w ramach Global Twitter Heartbeat, zespół z University of Illinois przeanalizował język i lokalizację ponad miliarda tweetów z całych Stanów Zjednoczonych, aby stworzyć wyrafinowane mapy takich rzeczy, jak pozytywne i negatywne emocje wyrażone podczas huraganu Sandy lub wsparcie dla Baracka Obama lub Mitt Romney podczas wyborów prezydenckich.

Jak zauważył Joshua Keating na blogu Wojna idei polityki zagranicznej, członkowie tej samej grupy, kierowani przez Kaleva Leetaru, poszli ostatnio o krok dalej. Jak opublikowano w nowym badaniu na początku tego tygodnia w internetowym czasopiśmie Pierwszy poniedziałek, przeanalizowano lokalizację i języki 46 672 798 tweetów opublikowanych między 23 października a 30 listopada ubiegłego roku, aby stworzyć oszałamiający portret ludzkiej działalności na całej planecie, pokazany na początek postu. Korzystali z dezaktywacji Twittera, strumienia danych, który przechwytuje losowe 10 procent wszystkich tweetów na całym świecie w danym czasie (które łącznie wyniosły 15 359 929 521 w danym okresie) i po prostu skupili się na tweetach z powiązanymi danymi geograficznymi.

Jak zauważają naukowcy, gęstość geograficzna tweetów w wielu regionach - szczególnie w świecie zachodnim, gdzie komputery, urządzenia mobilne i Twitter są używane na najwyższych poziomach - ściśle odpowiada wskaźnikom elektryfikacji i oświetlenia. W rezultacie mapy tweetów (takie jak szczegółowy widok kontynentalnych Stanów Zjednoczonych poniżej) wyglądają w nocy jak zdjęcia satelitarne sztucznego światła.

Kliknij, aby powiększyć. Zdjęcie przez pierwszy poniedziałek / Leetaru i in. glin.

W celu sprawdzenia, jak dobrze tweety pasują do wykorzystania sztucznego światła, stworzyli poniżej złożoną mapę, w której tweety są pokazane jako czerwone kropki, a oświetlenie nocne jest pokazane jako niebieskie. Obszary, w których odpowiadają one częstotliwości (i skutecznie się znoszą), są pokazane jako białe, a obszary, w których jedno przeważa nad drugim, pozostają czerwone lub niebieskie. Wiele obszarów wygląda na całkiem białych, z kilkoma kluczowymi wyjątkami: Iran i Chiny, gdzie Twitter jest zabroniony, są zauważalnie niebieskie, podczas gdy wiele krajów o stosunkowo niskich wskaźnikach elektryfikacji (ale gdzie Twitter jest nadal popularny) ma kolor czerwony.

Kliknij, aby powiększyć. Zdjęcie przez pierwszy poniedziałek / Leetaru i in. glin.

Projekt stał się jeszcze bardziej interesujący, gdy naukowcy wykorzystali zautomatyzowany system do dzielenia tweetów według języka. Najpopularniejszym językiem na Twitterze jest angielski, który stanowi 38, 25 procent wszystkich tweetów. Potem przyszli Japończycy (11, 84 procent), hiszpański (11, 37 procent), indonezyjski (8, 84 procent), norweski (7, 74 procent) i portugalski (5, 58 procent).

Zespół skonstruował mapę wszystkich tweetów napisanych w 26 najpopularniejszych językach, z których każdy jest reprezentowany przez inny kolor, poniżej:

Kliknij, aby powiększyć. Zdjęcie przez pierwszy poniedziałek / Leetaru i in. glin.

Chociaż tweety większości krajów są zdominowane przez ich języki urzędowe, ujawniono, że wiele tweetów zawiera tweety w wielu innych językach. Przyjrzyj się uważnie, a zobaczysz tęczę kolorów subtelnie wyskakującą z szarych kropek (angielskich tweetów) pokrywających USA:

Kliknij, aby powiększyć. Zdjęcie przez pierwszy poniedziałek / Leetaru i in. glin.

Między innymi analizami zespół badawczy przyjrzał się nawet geografii retweetowania i odwoływania się do niego - średniej odległości między użytkownikiem a kimś, kto przesyła dalej, a także średniej odległości między tym użytkownikiem a kimś, kogo po prostu wspomina w tweecie. Średnio odległość dla retweeta wynosiła 1115 mil i 1118 dla odniesienia. Ale wbrew intuicji istniała pozytywna zależność między liczbą powtórzeń danego użytkownika lub odniesień do innego użytkownika a ich odległością: pary użytkowników z niewielką liczbą interakcji częściej były bliżej siebie (500- 600 mil od siebie) niż te z dziesiątkami retweetów i referencji między nimi.

Oznacza to, że użytkownicy mieszkający daleko od siebie częściej korzystają z Twittera do regularnych interakcji. Jednym z wyjaśnień może być to, że podmioty, które mają najwięcej obserwujących - a więc najwięcej referencji i retweetów - są często celebrytami, organizacjami lub korporacjami, użytkownikami, z którymi ludzie się znają, ale w rzeczywistości nie mają z nimi osobistych relacji. Globalna mapa retweetów między użytkownikami znajduje się poniżej:

Kliknij, aby powiększyć. Zdjęcie przez pierwszy poniedziałek / Leetaru i in. glin.

W artykule omówiono jeszcze bardziej szczegółowo inne dane związane z tweetami: stosunek głównego nurtu wiadomości do liczby tweetów w danym kraju (Europa i USA otrzymują nieproporcjonalne relacje w mediach, podczas gdy Ameryka Łacińska i Indonezja są pomijane), miejsca, w których Twitter dodał ostatnio najwięcej użytkowników (Bliski Wschód i Hiszpania) oraz miejsca, w których użytkownicy mają średnio najwięcej obserwujących (Ameryka Południowa i zachodnie wybrzeże).

Istnieje kilka zastrzeżeń do wszystkich tych danych. Po pierwsze, chociaż tweety analizowane są w dziesiątkach milionów, wciąż stanowią zaledwie 0, 3 procent wszystkich wysłanych tweetów, więc mogą nie odzwierciedlać odpowiednio wszystkich wzorców Twittera, szczególnie jeśli użytkownicy, którzy włączają geotagowanie, zachowują się inaczej niż inni. Ponadto w szybko zmieniającym się świecie Twittera niektóre trendy mogły już się znacznie zmienić od ostatniej jesieni. Jednak wraz z rozwojem Twittera i udostępnianiem większej ilości danych oczywiste jest, że tego rodzaju analizy staną się bardziej popularne wśród demografów, informatyków i innych badaczy.

Świat Według Twittera w Mapach