Sztuczna inteligencja - jak ogrywa nas komputer?

Komputer pokonał człowieka w szachy. Komputer pokonał człowieka w Jeopardy! Komputer pokonał człowieka w Go. Komputer właśnie uczy się grać w stare gry komputerowe. No i komputer wpakował samochód pod ciężarówkę oraz najechał dziecku na stopę.

31 odcinek Świata w trzy minuty o najnowszych osiągnięciach “inteligentnych” urządzeń. Zapraszam!

Zaskoczenie, niedowierzanie, wreszcie – rezygnacja. Emocje na twarzy koreańskiego gracza mówią wszystko – komputer był lepszy. Graczem był Lee Sedol. Drugi najlepszy na świecie gracz w Go.

Plansza przecięta 19 liniami wzdłuż i wszerz, garść białych i czarnych kamieni, i cel gry – otoczenie swoimi kamieniami obszaru większego, niż zajęty przez przeciwnika. Proste? Banalne? Nie do końca. Komputery pokonały człowieka w kółko i krzyżyk w latach 50, a w warcabach i szachach krzem prześcignął białko dopiero latach 90. Mające kilka tysięcy lat historii Go miało być wyłączną domeną człowieka jeszcze przez dekadę. Jednak grający w Go komputer wykazał się… intuicją. I wygrał.

Pierwsze grające komputery grały na zasadzie prostego algorytmu: jeśli na planszy jest konkretna pozycja, to postaw pion w konkretnym miejscu. Da się go zastosować w przypadku prostych gier typu kółko i krzyżyk, gdzie – w zależności od sposobu liczenia – jest niespełna 30 tysięcy lub – jeśli naprawdę gramy, a nie stawiamy krzyżyki w losowych miejscach – nieco ponad tysiąc możliwych gier.

Potem bardziej skomplikowane gry. Pierwsze programy do gry w warcaby i szachy liczyły grę o kilka ruchów do przodu. Wykonywały wirtualny ruch, szukały na niego odpowiedzi przeciwnika, odpowiadały na odpowiedź i tak na kilka ruchów na przód. Potem sprawdzały, czy po takiej serii ruchów pozycja na planszy jest silniejsza czy słabsza i w ten sposób wybierały, co zrobić dalej. Część programów korzystała jeszcze z bazy partii historycznych, dzięki czemu mogła sprawdzić, czy podobna partia nie miała miejsca w przeszłości. Siłą rzeczy nie było tu miejsca na intuicję, była wyłącznie czysta matematyka.

W przypadku Go, gracz ma średnio 10x więcej możliwości ruchu niż w szachach, więc siłą rzeczy nie jest łatwo policzyć wszystko do przodu. Co więcej, liczbę wszystkich możliwych kombinacji ocenia się na większą, niż atomów we wszechświecie – więc dość sporo.

Wspomniałem o robocie, który najechał na dziecko w amerykańskim centrum handlowym. Twórcy tego typu maszyn mają z ludźmi podstawowy problem – jesteśmy nieprzewidywalni. Programista nie jest w stanie przewidzieć wszystkich naszych ruchów – a co dopiero ruchów dziecka, które – co wie każdy rodzic – w każdej sekundzie potrafi zmienić kierunek ruchu i prędkość biegu.

Jak rozwiązać ten, wydawałoby się nierozwiązywalny, problem? Chyba najlepiej sprawdza się próba odwzorowania w krzemie ludzkiego procesu myślowego. Programista tworzy szkielet, a następnie włącza tryb uczenia. Komputer analizuje miliony historycznych partii szachów czy Go, ogląda filmy pokazujące ludzkie zachowania, czyta książki – a następnie na podstawie zdobytej wiedzy ogrywa ludzi, pisze scenariusze, inwestuje na giełdzie czy steruje robotami pomagającymi nam w codziennym życiu.

Tak właśnie działa AlphaGo, który najpierw analizował zapisy archiwalnych partii, potem sam ze sobą rozegrał miliony gier, aż po długim treningu pokonał mistrza. Podobnie działa sztuczna inteligencja stworzona przez DeepMind – która uczy się grać w stare gry i powoli przechodzi znaną większości 35-latków Montezuma’s Revenge. Nieznającym tej gry dodam, że to jedna z najtrudniejszych gier na 8-bitowe komputery, i do jej przejścia – poza zręcznością – potrzebna jest umiejętność planowania.

“Inteligentne” komputery to ciekawa przyszłość. Boję się tylko, jak będzie wyglądała odpowiedzialność za ich działania. Nie tylko za autonomiczne pojazdy bojowe, lecz też za inteligentne samochody czy pomoce domowe, które mogą pewnego dnia odmówić posłuszeństwa. Bo czy każdemu będzie chciało się zaimplementować w system trzy prawa robotów Asimova?

Dodatkowe materiały: