https://frosthead.com

Ta pokerowa sztuczna inteligencja wie, kiedy ją trzymać, a kiedy ją spasować

Program komputerowy o nazwie Pluribus pokonał pokerzystów w serii sześcioosobowych gier Texas Hold'em bez limitu, osiągając kamień milowy w badaniach nad sztuczną inteligencją. To pierwszy bot, który pokonał ludzi w złożonej rozgrywce wieloosobowej.

Jak badacze z laboratorium AI na Facebooku i Carnegie Mellon University informują w czasopiśmie Science, Pluribus odniósł zwycięstwo w meczach zdominowanych przez ludzi i algorytmy. Początkowo Merrit Kennedy pisze dla NPR, pięć wersji bota zmierzyło się z jednym profesjonalnym pokerzystą; w następnej rundzie eksperymentów jeden bot grał przeciwko pięciu ludziom. Według posta na blogu na Facebooku AI wygrywało średnio około 5 USD na rozdanie, czyli 1000 USD na godzinę, grając z pięcioma ludzkimi przeciwnikami. Wskaźnik ten jest uważany za „decydujący margines zwycięstwa” wśród pokerzystów.

Rozmawiając z Kennedym, czterokrotnym mistrzem World Poker Tour, Darrenem Eliasem, wyjaśnia, że ​​pomógł trenować Pluribusa, konkurując z czterema stołami rywali botów i ostrzegając naukowców o błędach AI. Wkrótce bot „bardzo szybko się poprawiał, zmieniając się z przeciętnego gracza w pokera na poziomie światowej klasy w ciągu kilku dni i tygodni.” Jak mówi Elias, doświadczenie było „dość przerażające”.

Według Jamesa Vincenta z Verge, Pluribus - zaskakująco tani AI trenowany z zasobami chmurowymi o wartości poniżej 150 USD - dalej opanował strategię pokera, grając przeciwko sobie i ucząc się na zasadzie prób i błędów. Jak zauważa Jennifer Ouellette dla Ars Technica, bot szybko zdał sobie sprawę, że najlepszym sposobem działania jest połączenie rozgrywki i nieprzewidywalnych ruchów.

Większość ludzi zawodowych unika „zakładów na donki”, w których gracz kończy jedną rundę sprawdzeniem, a następny rozpoczyna od zakładu, ale Pluribus chętnie przyjmuje niepopularną strategię. W tym samym czasie, raporty Ouellette, AI oferowało także nietypowe rozmiary zakładów i wykazywało lepszą randomizację niż przeciwnicy.

„Jego główną siłą jest umiejętność stosowania mieszanych strategii”, powiedział Elias, zgodnie z oświadczeniem CMU. „To jest to samo, co ludzie próbują zrobić. Jest to kwestia egzekucji dla ludzi - robienie tego w sposób całkowicie losowy i konsekwentne. Większość ludzi po prostu nie może.

Pluribus nie jest pierwszą grą w pokera AI, która pokonała ludzkich profesjonalistów. W 2017 roku twórcy bota, Noam Brown i Tuomas Sandholm, opracowali wcześniejszą wersję programu o nazwie Libratus. Ta AI zdecydowanie pokonała czterech pokerzystów na 120 000 rozdań dla dwóch graczy Texas Hold'em, ale jak wyjaśnia blog na Facebooku, była ograniczona faktem, że walczyła tylko z jednym przeciwnikiem na raz.

Według „Will Knight” z MIT Technology Review, poker stanowi wyzwanie dla AI, ponieważ obejmuje wielu graczy i mnóstwo ukrytych informacji. Dla porównania, w grach takich jak szachy i Go bierze udział tylko dwóch uczestników, a pozycje graczy są widoczne dla wszystkich.

Aby pokonać te przeszkody, Brown i Sandholm opracowali algorytm zaprojektowany do przewidywania kolejnych dwóch lub trzech ruchów przeciwników, zamiast mierzenia ich kroków do końca gry. Chociaż strategia ta może wydawać się priorytetem dla krótkoterminowego zysku nad długoterminowymi wygranymi, Vincent z Verge pisze, że „krótkookresowe nacięcie jest naprawdę wszystkim, czego potrzebujesz”.

Idąc dalej, programy dla wielu graczy, takie jak Pluribus, mogłyby zostać wykorzystane do projektowania leków zdolnych do zwalczania bakterii opornych na antybiotyki, a także do poprawy cyberbezpieczeństwa i wojskowych systemów robotycznych. Tak jak Notatki Ars Technica dotyczące Ouellette, inne potencjalne zastosowania obejmują nadzorowanie negocjacji wielostronnych, wycenę produktów i strategie licytacji burzy mózgów.

Na razie, Brown mówi Knightowi, algorytm pozostanie w dużej mierze w tajemnicy - głównie w celu ochrony branży pokera online przed poniesieniem katastrofalnych strat finansowych.

Badacz podsumowuje: „Może to być bardzo niebezpieczne dla społeczności pokerowej”.

Ta pokerowa sztuczna inteligencja wie, kiedy ją trzymać, a kiedy ją spasować