Pobij czas sztucznej inteligencji w QWOP. Pewnie nie dasz rady

Maksym SłomskiSkomentuj
Pobij czas sztucznej inteligencji w QWOP. Pewnie nie dasz rady
Istnieje wiele gier wideo określanych jako trudne. Dark Souls, Cuphead, Sekiro: Shadows Die Twice czy Super Meat Boy to tylko niektóre z nich. Wile osób stwierdzi jednak, że absolutnie najtrudniejsza gra świata to… QWOP. Stanowi ona takie wyzwanie, że nawet sztuczna inteligencja wytrenowana z myślą o pobiciu w niej absolutnych rekordów, nie była w stanie zrealizować swojego zadania.

QWOP kontra sztuczna inteligencja

Jeżeli nigdy nie graliście w QWOP, musicie spróbować w niej swoich sił. Dopiero wtedy zdacie sobie sprawę z tego, o jak trudnej grze mowa. Ale o co w niej chodzi? W skrócie, stawia ona przed graczem zadanie poprowadzenia biegacza od startu do mety podczas biegu na 100 metrów. Problem w tym, że gracz musi pokierować oddzielnie różnymi częściami jego ciała – z pomocą klawisza Q na klawiaturze prawym udem, W lewym udem, O lewym podudziem, a P prawym podudziem. Naprawdę ciężko opanować ten system na tyle, by pokonać w grze chociażby 2 metry.

Wesley Liao, pewien specjalista w dziedzinie analizy danych, który prywatnie interesuje się technologiami związanymi z nauczaniem maszynowym, był ciekaw, jak w QWOP poradziłaby sobie sztuczna inteligencja. Aby to sprawdzić, Liao wpierw stworzył adapter Javascript, który pozwolił jego sztucznej inteligencji na wchodzenie w interakcję z grą.

Metoda prób i błędów

W jaki sposób Liao wytrenował swój model? Był to długi proces, składający się z wielu różnych podejść. Wpierw mężczyzna pozwolił SI na uczenie się na podstawie własnych rozgrywek – w ten sposób ta miała samodzielnie odkrywać, jakie czynności sprawią, że ta dobiegnie do mety i zrobi to szybko, a jakie doprowadzą do wywrócenia się zawodnika i porażki. Chociaż dzięki tej metodzie sztuczna inteligencja w końcu zdołała pokonać 100 metrów toru, ta była daleka od pobicia jakiegokolwiek czasowego rekordu.

Później Liao próbował sam opanować sztukę grania w QWOP, by nagrać swoje biegi i na podstawie filmów pokazać sztucznej inteligencji, co ta powinna robić, aby jej postać rzeczywiście biegała jak człowiek. Rezultaty były co najwyżej przeciętne, między innymi dlatego, że twórca modelu sam nie grał w QWOP zbyt dobrze – sztuczna inteligencja pojęła ideę stawiania kroków, ale nie wiedziała, jak ją wykorzystać.

Potem Liao pozwolił SI ponownie potrenować samodzielnie, by sprawdzić, czy ta w końcu wykorzysta nowo poznaną technikę. Ku jego zaskoczeniu, tak też się stało. Po 90 godzinach takiego treningu sztuczna inteligencja była w stanie ukończyć bieg w ciągu 1 minuty i 25 sekund. W rezultacie zajęła ona 14. miejsce w rankingu najlepszych graczy – niezłe, ale wciąż dalekie od szczytu.

Sztuczna inteligencja, gdy w końcu nauczyła się wykonywać w QWOP kroki. | Źródło: Wesley Liao

Ani trenując samodzielnie, ani wykorzystując filmy swojego twórcy, sztuczna inteligencja nie potrafiła odkryć techniki, z pomocą którą najlepsi gracze QWOP biją czasowe rekordy. Ci starają się przenosić nogi mocno do przodu i do góry, by znacznie lepiej się rozpędzać. Liao chciał pokazać algorytmowi tę motodę, ale nie posiadał wystarczających umiejętności, by móc tego dokonać.

Pomoc profesjonalisty

Na szczęście, pomocy badaczowi zgodził się udzielić ktoś, kto jest jednym z najlepszych graczy QWOP na świecie i zajmuje w rankingu 2. miejsce. Ta osoba to Kurodo (w rankingu pod pseudonimem kuroichi3). Kurodo udostępnił Wesleyowi Liao aż 50 filmów przedstawiających to, jak ten grał w QWOP.

Niestety, nawet po 65 godzinach treningu z wykorzystaniem nowych materiałów sztuczna inteligencja nie pobiła rekordu świata. Udało się jej uzyskać wynik na poziomie 1 minuty i 8 sekund, czyli plasujący się na 10. miejscu w rankingu. Dla porównania, obecny rekordzista pokonał QWOP w ciągu 48 sekund i 340 milisekund.

Liao wierzy, że po jeszcze dłuższym treningu i zastosowaniu innego systemu nagrody, być może sztuczna inteligencja w końcu zdołałaby pobić rekord w QWOP, ale póki co jest jej do tego daleko. Jedno jest jednak pewne – w tej chwili algorytm radzi sobie w tym tytule lepiej niż 99,9 procent graczy.

Źródło: Wesley Liao, fot. tyt. mat. własne

Udostępnij

Maksym SłomskiZ dziennikarstwem technologicznym związany od 2009 roku, z nowymi technologiami od dzieciństwa. Pamięta pakiety internetowe TP i granie z kumplami w kafejkach internetowych. Obecnie newsman, tester oraz "ten od TikToka". Miłośnik ulepszania swojego desktopa, czochrania kotów, Mazdy MX-5 i aktywnego uprawiania sportu. Wyznawca filozofii xD.