NOWA AI GOOGLE JEST MISTRZEM GIER, ALE JAK SIĘ MA DO LUDZKIEGO UMYSŁU? | INNOWACJE | SMITHSONIAN - ARTYKUŁY, INNOWACJE, TECHNOLOGIA, NAUKA

Dla ludzi opanowanie szachów może trwać całe życie. Ale nowy program sztucznej inteligencji Google DeepMind, AlphaZero, może nauczyć się podbijać planszę w ciągu kilku godzin.

Opierając się na swoim dotychczasowym sukcesie z pakietem AlphaGo - serią programów komputerowych zaprojektowanych do gry w chińską grę planszową Go - Google szczyci się tym, że nowa AlphaZero osiąga poziom „nadludzkiej wydajności” nie tylko w jednej grze planszowej, ale w trzech: Go, szachy i shogi (zasadniczo japońskie szachy). Zespół informatyków i inżynierów, kierowany przez Davida Silvera z Google, poinformował niedawno o swoich odkryciach w czasopiśmie Science .

„Wcześniej, dzięki uczeniu maszynowemu, można było uzyskać maszynę do robienia dokładnie tego, co chcesz - ale tylko to” - mówi Ayanna Howard, ekspert w dziedzinie interaktywnych obliczeń i sztucznej inteligencji w Georgia Institute of Technology, który nie brał udziału w Badania. „Ale AlphaZero pokazuje, że możesz mieć algorytm, który nie jest tak [specyficzny], i może uczyć się w ramach określonych parametrów.”

Sprytne programowanie AlphaZero z pewnością podnosi poprzeczkę zarówno dla ludzi, jak i maszyn, ale Google od dawna koncentruje się na czymś większym: inteligencji inżynierskiej.

Naukowcy starają się nie twierdzić, że AlphaZero jest na skraju dominacji nad światem (inni nieco szybciej skaczą z pistoletu). Mimo to Silver i reszta ekipy DeepMind mają już nadzieję, że pewnego dnia zobaczą podobny system stosowany w projektowaniu leków lub materiałoznawstwie.

Co sprawia, że AlphaZero jest tak imponujący?

Rozgrywka od dawna jest uznawana za złoty standard w badaniach nad sztuczną inteligencją. Ustrukturyzowane, interaktywne gry są uproszczeniami rzeczywistych scenariuszy: należy podjąć trudne decyzje; wygrane i straty podnoszą stawki; kluczowe znaczenie mają przewidywanie, krytyczne myślenie i strategia.

Kodowanie tego rodzaju umiejętności jest trudne. Starsze gry AI - w tym pierwsze prototypy oryginalnej AlphaGo - tradycyjnie były pełne kodów i danych, aby naśladować doświadczenie zdobywane zwykle przez lata naturalnej ludzkiej gry (zasadniczo pasywny zrzut wiedzy pochodzący od programisty). W AlphaGo Zero (najnowsza wersja AlphaGo), a teraz AlphaZero, naukowcy przekazali programowi tylko jeden wkład: zasady gry. Następnie system skulił się i aktywnie nauczył się sztuczek samego handlu.

AlphaZero jest oparty na AlphaGo Zero, części pakietu AlphaGo zaprojektowanego do gry w chińską grę planszową Go, pokazaną powyżej. Wczesne wersje oryginalnego programu były zasilane danymi z gier człowiek-człowiek; późniejsze wersje zajmujące się samokształceniem, w którym oprogramowanie grało przeciwko sobie w gry, aby nauczyć się własnej strategii. (Chad Miller / Flickr / CC BY-SA 2.0)

Strategia ta, zwana uczeniem się wzmocnienia we własnej grze, wygląda dokładnie tak, jak brzmi: Aby trenować w dużych ligach, AlphaZero grał w iteracji po iteracji, doskonaląc swoje umiejętności metodą prób i błędów. A podejście brutalnej siły się opłaciło. W przeciwieństwie do AlphaGo Zero, AlphaZero nie tylko gra w Go: może także pokonać najlepszych AI w branży w szachach i shogi. Proces uczenia się jest również imponująco wydajny, wymaga tylko dwóch, czterech lub 30 godzin samokształcenia, aby przewyższyć programy specjalnie dostosowane do opanowania, odpowiednio, shogi, szachy i Go. Howard twierdzi, że autorzy badania nie zgłosili żadnych przypadków, w których AlphaZero zmierzyłby się z prawdziwym człowiekiem. (Naukowcy mogliby założyć, że biorąc pod uwagę, że programy te konsekwentnie blokują ludzkie odpowiedniki, taki pojedynek byłby bezcelowy).

AlphaZero był również w stanie zmartwić Sztokfisz (obecnie nieosadzonego mistrza szachowego AI) i Elmo (były ekspert od shogi AI) pomimo oceny mniejszej liczby kolejnych ruchów w każdej turze podczas gry. Ponieważ jednak omawiane algorytmy są z natury różne i mogą zużywać różne ilości energii, trudno jest bezpośrednio porównać AlphaZero z innymi, starszymi programami, zwraca uwagę Joanna Bryson, która studiowała sztuczną inteligencję na University of Bath w Wielkiej Brytanii i zrobiła to nie przyczyniać się do AlphaZero.

Google utrzymuje mamę na temat drobnego druku w swoim oprogramowaniu, a AlphaZero nie jest wyjątkiem. Chociaż nie wiemy wszystkiego o zużyciu energii przez program, jasne jest to, że AlphaZero musi pakować poważną amunicję obliczeniową. W tych niewielkich godzinach treningu program był bardzo zajęty, angażując się w dziesiątki lub setki tysięcy rund treningowych, aby podnieść strategię gry planszowej do tabaki - o wiele więcej niż człowiek potrzebowałby (lub w większości przypadków mógłby nawet osiągnąć) w pogoni za biegłością.

W tym intensywnym schemacie wykorzystano również 5000 zastrzeżonych przez Google procesorów do uczenia maszynowego lub TPU, które według niektórych szacunków zużywają około 200 watów na układ. Bez względu na to, jak go pokroisz, AlphaZero wymaga znacznie więcej energii niż ludzki mózg, który działa na około 20 watów.

Należy wziąć pod uwagę bezwzględne zużycie energii przez AlphaZero, dodaje Bin Yu, który pracuje na styku statystyk, uczenia maszynowego i sztucznej inteligencji na University of California w Berkeley. AlphaZero jest potężny, ale może nie być dobrym hukiem, zwłaszcza jeśli dodaje się osobogodziny, które poświęcono na jego stworzenie i wykonanie.

Energicznie drogie czy nie, AlphaZero robi plusk: większość AI jest hiperspecjalistami w jednym zadaniu, dzięki czemu ten nowy program - z potrójnym zagrożeniem gry - jest niezwykle elastyczny. „To imponujące, że AlphaZero był w stanie używać tej samej architektury dla trzech różnych gier”, mówi Yu.

Więc tak. Nowa sztuczna inteligencja Google ustanawia nowy znak na kilka sposobów. To jest szybkie. Jest potężny. Ale czy to czyni go inteligentnym?

To tutaj definicje stają się mętne. „AlphaZero był w stanie nauczyć się, od podstaw bez wiedzy człowieka, grać w każdą z tych gier na nadludzkim poziomie”, powiedział DeepMind's Silver w oświadczeniu dla prasy.

Nawet jeśli wiedza specjalistyczna w zakresie gier planszowych wymaga ostrości umysłu, wszystkie proxy w prawdziwym świecie mają swoje ograniczenia. W bieżącej wersji AlphaZero rozwija się, wygrywając gry zaprojektowane przez ludzi - co może nie uzasadniać potencjalnie alarmującej etykiety „nadludzkiej”. Ponadto, jeśli zaskoczy go nowy zestaw zasad w trakcie gry, AlphaZero może ulec flummoxowi. Z drugiej strony rzeczywisty ludzki mózg może przechowywać w swoim repertuarze znacznie więcej niż trzy gry planszowe.

Co więcej, porównywanie linii bazowej AlphaZero z tabula rasa (pusta tablica) - tak jak robią to badacze - jest ciągłe, mówi Bryson. Programiści wciąż karmią go jednym istotnym fragmentem ludzkiej wiedzy: zasadami gry, w którą zamierza zagrać. „To ma o wiele mniej do zrobienia niż cokolwiek wcześniej”, dodaje Bryson, „ale najbardziej fundamentalną rzeczą jest to, że wciąż ma określone zasady. To są wyraźne. ”

I te nieznośne zasady mogą stanowić znaczącą kulę. „Mimo że te programy uczą się, jak wykonywać, potrzebują zasad drogowych” - mówi Howard. „Świat jest pełen zadań, które nie mają tych zasad”.

Kiedy wypycha się do przodu, AlphaZero jest ulepszeniem już potężnego programu - AlphaGo Zero, wyjaśnia JoAnn Paul, który studiuje sztuczną inteligencję i marzenia obliczeniowe w Virginia Polytechnic Institute i State University i nie był zaangażowany w nowe badania. AlphaZero wykorzystuje wiele takich samych elementów składowych i algorytmów jak AlphaGo Zero i nadal stanowi tylko podzbiór prawdziwych smartów. „Myślałem, że ten nowy rozwój był bardziej ewolucyjny niż rewolucyjny”, dodaje. „Żaden z tych algorytmów nie może utworzyć . Inteligencja dotyczy także opowiadania historii. Wyobraża sobie rzeczy, których jeszcze nie ma. Nie myślimy w tych kategoriach w komputerach. ”

Część problemu polega na tym, że nadal nie ma zgody na prawdziwą definicję „inteligencji”, mówi Yu, i to nie tylko w dziedzinie technologii. „Nadal nie jest jasne, w jaki sposób trenujemy istot krytycznie myślących, ani w jaki sposób wykorzystujemy nieświadomy mózg” - dodaje.

Do tej pory wielu badaczy uważa, że istnieje prawdopodobnie wiele rodzajów inteligencji. A stukanie w jedno dalekie od gwarantuje składniki dla drugiego. Na przykład niektórzy najmądrzejsi ludzie są okropni w szachach.

Przy tych ograniczeniach wizja Yu dotycząca przyszłości sztucznej inteligencji współpracuje z ludźmi i maszynami w rodzaju koewolucji. Wyjaśnia, że maszyny z pewnością będą nadal przodować w niektórych zadaniach, ale wkład ludzki i nadzór mogą zawsze być konieczne, aby zrekompensować niezaangażowane.

Oczywiście nie wiadomo, jak potrząśnie się na arenie AI. W międzyczasie mamy wiele do przemyślenia. „Te komputery są potężne i potrafią robić pewne rzeczy lepiej niż ludzie” - mówi Paul. „Ale to wciąż nie jest tajemnicą inteligencji”.

Ten artykuł został pierwotnie opublikowany na NOVA.