https://frosthead.com

Test Turinga mierzy coś, ale to nie jest „inteligencja”

Alan Turing, jeden z ojców ery komputerowej, był wyjątkowo mądrym człowiekiem. W rzeczywistości tak sprytny, że zrozumiał, że termin „inteligencja maszyny” był prawie bez znaczenia. Usprawiedliwiał, że lepiej mówić o tym, co może zrobić maszyna: czy może mówić? Czy to może powstrzymać rozmowę? Przynajmniej jest to coś, co możemy spróbować zbadać. Ostatecznie Turing zaproponował coś, co nazywa się „testem Turinga”: jeśli sędzia nie jest w stanie stwierdzić, który z dwóch ukrytych bytów jest człowiekiem, a który jest sztuczny, maszyna „przeszła” test - co dokładnie podobno wydarzyło się w ubiegłą sobotę w Londynie.

powiązana zawartość

  • Dolina Krzemowa zawdzięcza swój sukces genialnemu technologowi, o którym nigdy nie słyszałeś
  • 60-letnia prognoza Alana Turinga na temat wzorów w naturze okazała się prawdziwa

„Z… dumą ogłaszamy, że test Alana Turinga został zdany po raz pierwszy”, powiedział jeden z organizatorów, Kevin Warwick z University of Reading, gdy ogłoszono wyniki. Zwycięski chatbot nosi nazwę „Eugene Goostman”, program komputerowy, który naśladuje osobowość 13-letniego ukraińskiego chłopca. „Eugene” zdołał przekonać 33 procent sędziów, że był to człowiek podczas sobotniej imprezy, która odbyła się w siedzibie Royal Society w Londynie w 60. rocznicę śmierci Turinga. (Turing, homoseksualista, został skazany za rażącą nieprzyzwoitość w 1952 r. I nakazano mu poddać się „leczeniu hormonalnemu” w ramach umowy o przyznanie się do pomocy. Dwa lata później zmarł z powodu zatrucia cyjankiem w pozornym samobójstwie.)

Ale słowo ostrzeżenia jest w porządku. „Inteligencja” zawsze była śliskim tematem, a test Turinga od dawna był pełen kontrowersji. Turing opisał, jak to zadziała w artykule z 1950 r. Zatytułowanym „Maszyny komputerowe i inteligencja”. Wziął ten pomysł z tradycyjnej wiktoriańskiej gry towarzyskiej, w której próbujesz dowiedzieć się, czy osoba ukryta za zasłoną to mężczyzna czy kobieta, tylko zadając pytania. (Odpowiedzi na pytania musiały zostać zapisane, ponieważ głos byłby rozdawcą.) Oto, jak działałaby wersja Turinga: miałbyś sędziego siedzącego przed dwiema zasłonami, bez możliwości dowiedzenia się, co za nimi stoi . Za jedną zasłoną stoi człowiek; za drugim jest komputer. Sędzia może zadawać pytania jednej z dwóch ukrytych jednostek. Na podstawie odpowiedzi sędzia próbuje dowiedzieć się, czy ukryta istota jest człowiekiem czy maszyną. (Turing wyobrażał sobie, że rozmowa jest prowadzona przez maszyny teletekstowe; dziś możemy korzystać z dowolnego rodzaju elektronicznego interfejsu tekstowego, takiego jak ten używany w czatach internetowych lub komunikatorach internetowych.)

Turing spekulował, że do 2000 roku „przeciętny śledczy nie będzie miał więcej niż 70 procent szans na dokonanie właściwej identyfikacji” - to znaczy programy komputerowe utrudnią sędziom 30 procent czasu - po pięciu minutach przesłuchania. Ważne jest „pięć minut”. Turing nie mówił o limicie czasu jako nieodłącznej części testu i można argumentować, że aby maszyna naprawdę zdała test, powinna być w stanie obsłużyć każdą ilość pytań. Przypuszczalnie pięciominutowe kryteria były arbitralne, ale konieczne. Rok 2000 przyszedł i odszedł, a chatboty robiły tylko postępy. (W bardziej trzeźwym momencie, odpowiadając na pytanie ankietera BBC w 1952 r., Turing powiedział, że minie 100 lat, zanim maszyna przejdzie test).

W 2012 roku byłem sędzią podczas „maratonu testowego Turinga”, największego w historii zestawu testów Turinga przeprowadzonych jednocześnie; odbyło się ono w Bletchley Park w Anglii, miejscu kluczowej pracy Turinga w zakresie łamania kodów w ostatnich latach drugiej wojny światowej. (Zostało zorganizowane przez ten sam zespół, który poprowadził sobotnie wydarzenie, a tym razem zwyciężyła także wcześniejsza wersja Eugene'a.) Konfiguracja sobotniego wydarzenia była taka sama jak w 2012 roku: sędziowie wpisywali pytania na komputerze, a następnie czekał, aż odpowiedzi pojawią się na ekranach; chatboty wraz z „ukrytymi ludźmi” znajdowały się w innym pomieszczeniu poza zasięgiem wzroku.

Pierwszą rzeczą, na którą zwróciłem uwagę, jest to, że kiedy jesteś sędzią w teście Turinga, pięć minut mija dość szybko. Im krótsza rozmowa, tym większa przewaga komputera; im dłuższe przesłuchanie, tym większe prawdopodobieństwo, że komputer się ujawni. Nazywam to efektem manekina: czy przeprosiłeś kiedyś manekin z domu handlowego, zakładając, że właśnie wpadłeś na żywą istotę ludzką? Jeśli spotkanie trwa tylko ułamek sekundy, a ty patrzysz w drugą stronę, możesz sobie wyobrazić, że po prostu otarłeś się o człowieka. Im dłuższe spotkanie, tym bardziej oczywisty jest manekin manekina.

To samo dotyczy chatbotów. Wymiana cześć nic nie ujawnia - ale im bardziej się w to zagłębia, tym więcej problemów się pojawia. Odkryłem, że chatboty wydają się być skłonne do zmiany tematu bez powodu. Często nie potrafią odpowiedzieć na proste pytania. Ryzykując, że zabrzmią niejasno, po prostu nie brzmią jak ludzie . W jednej z moich rozmów w 2012 roku napisałem prosty żart - a podmiot, z którym rozmawiałem, natychmiast zmienił temat na hamburgery. (Informatyk Scott Aaronson miał ostatnio podobne doświadczenia, kiedy rozmawiał z Eugene'em za pośrednictwem strony bota. Aaronson zapytał Eugene'a, ile nóg ma wielbłąd; odpowiedział: „Coś między 2 a 4. Może trzy ?:-)))” Później, gdy Aaronson zapytał, ile nóg ma mrówka, Eugene zakaszlał dokładnie tę samą odpowiedź, potrójną buźkę i tak dalej.)

Zauważ też, że Eugene nie naśladuje osoby dorosłej anglojęzycznej; udaje, że jest młodym i nieco nieśmiałym nastolatkiem ukraińskim, rozmawiającym w dość dobrym (ale dalekim od doskonałego) języku angielskim. Jak powiedział Vladimir Veselov, jeden z programistów programu, Mashable.com : „Spędziliśmy dużo czasu na rozwijaniu postaci o wiarygodnej osobowości”. Chociaż Eugene będzie angażował każdego w dowolny temat, jego wiek „sprawia, że ​​jest całkowicie uzasadnione, że nie robi „wiem wszystko”. Eugene nie wychodzi od razu i ogłasza swój wiek i narodowość; ale ujawni to, jeśli zostanie o to poproszony - a efektem końcowym może być pewna wyrozumiałość ze strony sędziów, szczególnie jeśli chodzi o gramatykę angielską i użycie słów. (Zakładam, że większość sędziów w sobotę była rodzimymi użytkownikami języka angielskiego, choć nie wiem tego na pewno.) Tabele prawdopodobnie przewróciłyby się, gdyby Eugene kiedykolwiek spotkał się z rodzimym językiem ukraińskim jako sędzią.

Walka o zbudowanie gadającej maszyny pokazuje, jak skomplikowany jest język. Nie chodzi tylko o rozmowę - musisz o czymś porozmawiać, a to, co mówisz, musi mieć sens - i musi mieć sens w kontekście tego , co właśnie powiedziała druga osoba . Dla nas jest to łatwe; dla komputerów, nie tyle. I tak, chatboty polegają na szeregu sztuczek: zapamiętywaniu megabajtów odpowiedzi w puszkach lub przeszukiwaniu Internetu w poszukiwaniu dialogu, który może być zbliżony do rozmowy, w której aktualnie się znajdują. Innymi słowy, to, czego brakuje maszynie w inteligencji, może nadrobić surową mocą obliczeniową. Właśnie dlatego Google lub Siri (osobisty asystent iPhone'a) mogą wydawać się nam tak sprytni: Siri może nie mieć „umysłu”, ale ma dostęp do tak dużej bazy danych, może zachowywać się tak, jakby to robiła. To było takie samo podejście brutalnej siły, które pozwoliło IBM „Watson” wygrać w Jeopardy! w 2011.

Wszystko to rodzi kluczowe pytanie: co dokładnie mierzy test Turinga? Niektórzy krytycy sugerują, że nagradzanie to oszustwo, a nie inteligencja. Psycholog z NYU Gary Marcus, piszący na NewYorker.com, mówi, że Eugene'owi udaje się „wykonać serię„ sztuczek ”mających na celu ukrycie ograniczeń programu”. Steven Harnad, psycholog i informatyk z University of Quebec w Montrealu, był jeszcze bardziej sceptycznie, mówiąc Strażnikowi, że „kompletnym nonsensem” jest twierdzenie, że Eugene zdał test Turinga. (Trzeba przyznać, że Turing doskonale zdawał sobie sprawę z tego problemu; nazwał swój pomysł „grą naśladownictwa” i mówił o inteligencji tylko oszczędnie.) Jeszcze bardziej niezręcznie komputer, w przeciwieństwie do człowieka, jest zmuszony oszukiwać. „Test Turinga jest naprawdę sprawdzianem sukcesu jako kłamca”, powiedział Pat Hayes, informatyk z Institute for Human and Machine Cognition w Pensacola na Florydzie, po maratonie testowym w Turingu w 2012 roku. „Gdybyś miał coś, co naprawdę mogło przejść grę imitującą Turinga, byłby to bardzo udany„ ludzki naśladownik ”.”

A „człowiek” to druga kluczowa kwestia: czy nie jest możliwe, że na świecie istnieją inne rodzaje inteligencji, wykraczające poza te wykazywane przez nasz gatunek? Naprawdę inteligentna maszyna miałaby niezliczone praktyczne zastosowania, ale po co skupiać się na tworzeniu większej liczby „ludzi”? W końcu mamy już wielu ludzi. Jak zauważył językoznawca Noam Chomsky, kiedy staramy się zbudować maszynę, która porusza się pod wodą, nie wymagamy od niej „pływania” - a łódź podwodna jest nie mniej osiągnięciem ze względu na jej niezdolność do wykonania uderzenia grzbietu.

Tak, Eugene robi wrażenie, przynajmniej w małych seriach. A jednak nawet najlepsi chatboty natkną się na pytania, z którymi dziecko w połowie wieku Eugene'a mogłoby sobie poradzić. Być może nic dziwnego, że większość badaczy AI spędza mało czasu na obsesji na punkcie testu Turinga. Inteligencja maszyn w rzeczywistości idzie naprzód i dość szybko. Oprogramowanie do tłumaczenia głosu na tekst, które jeszcze kilka lat temu było dość żałosne, szybko się poprawia, podobnie jak programy do tłumaczenia języków. Amazon często ma całkiem dobry pomysł na to, co chcesz kupić, zanim to zrobisz. A samodzielny samochód Google'a jeszcze dziesięć lat temu byłby tylko fantazją. Jednak rozmowa, którą ciągle odkrywamy, jest naprawdę trudna i prawdopodobnie nie będzie granicą, na której AI świeci najjaśniej. Na razie, jeśli szukasz kogoś do rozmowy, polecam prawdziwego człowieka.

Dan Falk jest dziennikarzem naukowym z siedzibą w Toronto.

Test Turinga mierzy coś, ale to nie jest „inteligencja”