Istnieje wiele różnych powodów, dla których naukowcy mogą chcieć spojrzeć na imię ludzi i wywnioskować ich pochodzenie etniczne, płeć lub wiek. Weźmy naukowców zajmujących się zdrowiem publicznym, którzy chcą ustalić różnice w opiece zdrowotnej między grupami etnicznymi. Jeśli mogą używać nazwisk do sortowania ludzi, mogą uniknąć konieczności wychodzenia i uzyskiwania danych rasowych i etnicznych od każdego pacjenta. Niektórzy badacze używają oprogramowania do rozpoznawania twarzy, aby poprawić szacunki wieku i płci na zdjęciach. Niektórzy sugerują, że niepopularne nazwiska mogą być skorelowane z przestępczością nieletnich.
Ale ile naprawdę możesz powiedzieć po czyimś nazwisku? Pete Warden, inżynier i bloger, opisuje niektóre z dostępnych technik analizy nazw.
Na przykład w amerykańskim spisie ludności publikowane są listy popularnych nazwisk według płci i roku urodzenia. Minnie była piątą najpopularniejszą nazwą w 1880 roku i dziś prawie zniknęła. W 2012 r. Miejsce pięć zajmowała Ava. Płeć jest prawdopodobnie najłatwiejszym rozróżnieniem nazwisk, pisze Warren. Chociaż są z pewnością wyjątki, Mikes i Bobs to zazwyczaj mężczyźni, podczas gdy Sarah i Sallies to kobiety. Drugą najłatwiejszą rzeczą do powiedzenia jest pochodzenie etniczne. Amerykański spis powszechny ma również listę 150 000 nazwisk rodowych według pochodzenia etnicznego. Warden pisze:
Azjatyckie i latynoskie nazwiska są zazwyczaj dość unikalne dla tych społeczności, więc ich występowanie stanowi silny sygnał, że dana osoba jest członkiem tej grupy etnicznej. Istnieją jednak pewne mylące czynniki, szczególnie w przypadku nazw pochodzących z Hiszpanii na Filipinach. Istnieją pewne nazwiska, szczególnie te z Niemiec i krajów skandynawskich, które zdecydowanie wskazują, że właściciel ma europejskie pochodzenie, ale wiele nazwisk jest rasowych. Istnieją pewne skojarzenia między Afroamerykanami a niektórymi nazwiskami, takimi jak Jackson czy Smalls, ale są one również wspólne dla wielu osób z innych grup etnicznych. Te dwuznaczności sprawiają, że miary latynoskie i nieazjatyckie są bardziej wskaźnikami niż mocnymi wskaźnikami, i nie powiedzą ci wiele, dopóki nie przejdziesz do setek najlepszych pod względem wielkości próby.
Wiek jest najtrudniejszy. Chociaż Minnie nie jest już popularna, wciąż jest w pobliżu. Wiele nazwisk, takich jak Ava, wraca do mody. Podobnie jak niegrzeczne jest odgadywanie czyjegoś wieku na podstawie ich twarzy, prawdopodobnie jest to zły pomysł, aby odgadnąć to po imieniu.
Używanie nazw w celu wywnioskowania rzeczy takich jak płeć i pochodzenie etniczne może być przydatne dla wszystkich naukowców.
Facebook wykorzystał te informacje nawet do określenia, jak różnorodne są strony użytkowników. Badacz danych na Facebooku Cameron Marlow pisze:
Trudno odpowiedzieć na to pytanie, ponieważ w przeciwieństwie do informacji takich jak płeć czy wiek, Facebook nie prosi użytkowników o podzielenie się swoim pochodzeniem etnicznym lub rasą w swoich profilach. Aby odpowiedzieć na to pytanie, skupiliśmy się na jednym kraju o dużej i zróżnicowanej populacji - Stanach Zjednoczonych. Porównując nazwiska ludzi na Facebooku z danymi zebranymi przez US Census Bureau, jesteśmy w stanie oszacować rozkład rasowy użytkowników Facebooka w historii strony.
Facebook stwierdził, że od 2005 r. Mieszkańcy Azji / Pacyfiku są znacznie bardziej skłonni do korzystania z Facebooka niż Whites. Biali i czarni użytkownicy są prawie równi, a Hiszpanie pozostają w tyle.
Ogólnie jednak odgadywanie nazwisk jest trudne. Zawsze są lady Alexa i chińscy Smithowie. Wielu imigrantów zmienia swoje nazwiska, gdy się poruszają, zagmatwając korelacje. Ale jeśli naukowcy mogą uzyskać dobre przybliżenia, mogą je wykorzystać, aby dowiedzieć się, co się dzieje z dużymi grupami ludzi, bez konieczności zadawania im pytań.
Więcej z Smithsonian.com:
Oto jak działa nazewnictwo Hurricane
Czy twoje nazwisko wpływa na nawyki zakupowe?