https://frosthead.com

Czy komputery mogą rozszyfrować 5000-letni język?

Cywilizacja Indusów, która kwitła przez większość trzeciego tysiąclecia pne, była najobszerniejszym społeczeństwem swoich czasów. W swojej wysokości obejmował obszar ponad pół miliona mil kwadratowych, skoncentrowany na dzisiejszej granicy indyjsko-pakistańskiej. Pozostałości Indusów znaleziono tak daleko na północ, jak w Himalajach i tak daleko na południe, jak w Mumbaju. Była to najwcześniej znana kultura miejska subkontynentu i szczyciła się dwoma dużymi miastami, jednym w Harappa i jednym w Mohenjo-daro. Jednak pomimo jego wielkości i długowieczności oraz pomimo prawie stulecia badań archeologicznych wiele o Indusie pozostaje owiane tajemnicą.

To, co niewiele wiemy, pochodzi z wykopalisk archeologicznych, które rozpoczęły się w latach dwudziestych XX wieku i trwają do dziś. Przez dziesięciolecia archeolodzy odkryli wiele artefaktów, w tym pieczęci pieczęci, amuletów i małych tabletek. Wiele z tych artefaktów zawiera coś, co wydaje się być okazem pisma - grawerowane postacie przypominające między innymi skrzydlate podkowy, koła szprychowe i stojące ryby. To, co dokładnie mogą oznaczać te symbole, pozostaje jedną z najbardziej znanych nierozwiązanych zagadek w stypendium starożytnych cywilizacji.

W historii istniały inne trudne kody do złamania. Zaskoczeni egiptolodzy wpadli na szczęście, odkrywając słynny kamień z Rosetty w 1799 r., Który zawierał tekst zarówno w języku egipskim, jak i greckim. Studium hieroglifów Majów pogarszało się, dopóki rosyjski językoznawca Yury Knorozov sprytnie wykorzystał współczesny mówiony Majów w latach 50. XX wieku. Ale nie ma kamienia Rosetta z Indusu, a uczeni nie wiedzą, jakie języki mogą pochodzić od tego, którym posługują się Indusi.

Około 22 lat temu, w Hyderabad w Indiach, uczeń ósmej klasy o imieniu Rajesh Rao przewrócił stronę podręcznika historii i po raz pierwszy dowiedział się o tej fascynującej cywilizacji i jej tajemniczym scenariuszu. W następnych latach wykształcenie i zawód Rao poprowadziły go w innym kierunku - skończył nauką komputerową, której uczy dzisiaj na Uniwersytecie Waszyngtońskim w Seattle - ale uważnie monitorował stypendium Indusa, śledząc dziesiątki nieudanych próby zrozumienia sensu skryptu. Kiedy studiował sztuczną inteligencję i robotykę, Rao zgromadził niewielką bibliotekę książek i monografii na skrypcie Indus, około 30 z nich. Na pobliskim półce z książkami trzymał również ceniony podręcznik historii ósmej klasy, który przedstawił go Indusowi.

„To było niesamowite zobaczyć liczbę różnych pomysłów, które ludzie zasugerowali” - mówi. Niektórzy uczeni twierdzili, że pismo było rodzajem sumeryjskiego pisma; inni umieścili go w rodzinie drawidyjskiej; jeszcze inni uważali, że jest to związane z językiem Wyspy Wielkanocnej. Rao docenił fakt, że był to „prawdopodobnie jeden z najtrudniejszych problemów w historii starożytnej”.

Ponieważ próba po próbie nie udało się odszyfrować skryptu, niektórzy eksperci zaczęli tracić nadzieję, że można go odkodować. W 2004 r. Trzech uczonych argumentowało w kontrowersyjnej pracy, że symbole Indusu w ogóle nie miały treści językowej. Zamiast tego symbole mogły być niewiele więcej niż piktogramami przedstawiającymi postaci polityczne lub religijne. Autorzy posunęli się tak daleko, że zasugerowali, że Indus wcale nie był piśmienną cywilizacją. Dla niektórych w terenie cała próba znalezienia języka za tymi wytrawami Indusów zaczęła przypominać ćwiczenie na próżno.

Kilka lat później Rao wszedł do walki. Do tego czasu ludzie studiujący scenariusz byli archeologami, historykami, językoznawcami lub kryptologami. Ale Rao postanowił odkryć sekrety skryptu Indus przy użyciu narzędzia, które znał najlepiej - informatyki.

Zafascynowany cywilizacją Indus od ósmej klasy, Rajesh Rao używa informatyki i koncepcji zwanej „entropią warunkową”, aby pomóc w odkodowaniu skryptu Indus. (Dzięki uprzejmości Davida Zaxa) Przez dziesięciolecia archeolodzy odkryli wiele artefaktów z cywilizacji Indusów, w tym pieczęcie pieczęci, amulety i małe tabliczki. (Robert Harding / Robert Harding World Imagery / Corbis) Rao i jego współpracownicy opublikowali swoje odkrycia w czasopiśmie Science w maju. Nie rozszyfrowali języka, ale ich odkrycia poprawiły jego zrozumienie. (Robert Harding / Robert Harding World Imagery / Corbis) Rao i jego koledzy przyglądają się teraz dłuższym ciągom znaków niż analizowali w artykule naukowym . Znalezienie wzorców pomogłoby z kolei ustalić, do których rodzin języków może należeć skrypt. (Dzięki uprzejmości Davida Zaxa)

W letni dzień w Seattle Rao przywitał mnie w swoim biurze, aby pokazać mi, jak on i jego koledzy podeszli do problemu. Przedstawił zbiór replik odcisków pieczęci glinianych, które archeolodzy odkryli na stanowiskach w Indusie. Są małe - jak małe kwadratowe czekoladki - i większość z nich przedstawia wizerunek zwierzęcia pod serią symboli Indusu. Większość próbek skryptu Indus to takie miniatury, które zawierają tylko kilka znaków; nie odkryto żadnych wielkich monolitów. Rao powiedział mi, że uczeni nie są pewni co do funkcji małych pieczęci, ale jedna z teorii głosi, że mogły zostać wykorzystane do poświadczenia jakości sprzedawanych towarów. Inny sugeruje, że pieczęcie mogły być sposobem na zapewnienie, że handlowcy płacili podatki przy wjeździe do miasta lub opuszczeniu go - wiele ruin znaleziono w ruinach bram, które mogły funkcjonować jak starożytne budki z opłatami.

Rao i jego koledzy nie starali się czynić cudów - wiedzieli, że nie mają wystarczających informacji, aby rozszyfrować starożytny skrypt - ale postawili hipotezę, że stosując metody obliczeniowe, mogą przynajmniej zacząć ustalać, jaki rodzaj pisania Indusu skrypt był: czy kodował język, czy nie? Zrobili to za pomocą pojęcia zwanego „entropią warunkową”.

Pomimo narzucającej nazwy entropia warunkowa jest dość prostym pojęciem: jest miarą ilości losowości w sekwencji. Rozważ nasz alfabet. Jeśli weźmiesz płytki Scrabble i podrzucisz je w powietrze, możesz znaleźć każdą starą literę pojawiającą się po drugiej. Ale w prawdziwych angielskich słowach niektóre litery częściej występują po innych. Po q po angielsku prawie zawsze następuje u . Po t może następować r lub e, ale rzadziej po nim występuje n lub b .

Rao i jego współpracownicy - międzynarodowa grupa złożona z informatyków, astrofizyków i matematyka - użyli programu komputerowego do zmierzenia warunkowej entropii skryptu Indus. Następnie zmierzyli entropię warunkową innych rodzajów systemów - języków naturalnych (sumeryjski, tamilski, sanskryt i angielski), języka sztucznego (komputerowy język programowania Fortran) i systemów niejęzykowych (sekwencje ludzkiego DNA, bakteryjne sekwencje białkowe i dwa sztuczne zestawy danych reprezentujące wysokie i niskie skrajności entropii warunkowej). Kiedy porównali losowość w skrypcie Indus z innymi systemami, stwierdzili, że najbardziej przypomina on wskaźniki występujące w językach naturalnych. Wyniki swoich badań opublikowali w maju w czasopiśmie Science .

Jeśli wygląda jak język i działa jak język, to prawdopodobnie jest to język, sugeruje ich praca. Odkrycia nie odszyfrowują oczywiście skryptu, ale pogłębiają nasze rozumienie go i dają otuchę archeologom, którzy pracowali przy założeniu, że skrypt indus koduje język.

Po opublikowaniu artykułu Rao otrzymał niespodziankę. Okazuje się, że pytanie, do której rodziny językowej należy skrypt, jest delikatne: ze względu na wiek i znaczenie cywilizacji Indusu wiele współczesnych grup w Indiach chciałoby uznać ją za bezpośredniego przodka. Na przykład, mówiący po tamilsku Indianie z południa woleliby dowiedzieć się, że pismo indusskie było rodzajem proto-dravidian, ponieważ tamilski jest potomkiem proto-dravidian. Mówiący po hindi na północy woleliby raczej starą formę sanskrytu, przodka hindi. W artykule Rao nie stwierdza się, do której rodziny językowej należy skrypt, choć zauważa, że ​​entropia warunkowa jest podobna do Old Tamil - powodując, że niektórzy krytycy „oskarżają nas o bycie nacjonalistami z Dravidian” - mówi Rao. „Zaciekłość oskarżeń i ataków była całkowicie nieoczekiwana”.

Rao czasami odczuwa ulgę, wracając do mniej zażartego świata neurobiologii i robotyki. Ale wezwanie do napisania skryptu Indus pozostaje pociągające, a „to, co kiedyś było hobby, teraz monopolizuje ponad jedną trzecią mojego czasu”, mówi. Rao i jego koledzy przyglądają się teraz dłuższym ciągom znaków niż analizowali w artykule naukowym . „Jeśli istnieją wzorce”, mówi Rao, „moglibyśmy wymyślić reguły gramatyczne. To z kolei ograniczyłoby rodzaje rodzin językowych ”, do którego może należeć skrypt.

Ma nadzieję, że jego przyszłe odkrycia będą mówić same za siebie, podżegając do mniej urazy ze strony przeciwników zakorzenionych w jednym regionie Indii w porównaniu z innym. Ze swojej strony, gdy Rao mówi o tym, co znaczy dla niego skrypt Indus, ma on tendencję do mówienia w odniesieniu do Indii jako całości. „Dziedzictwo Indii byłoby znacznie wzbogacone, gdybyśmy byli w stanie zrozumieć cywilizację Indusów” - mówi. Rao i jego współpracownicy pracują nad tym, po jednym wierszu kodu źródłowego na raz.

Czy komputery mogą rozszyfrować 5000-letni język?