Sztuczna inteligencja uczy się grać w Mario. Zobacz jej postępy na TikToku

Anna BorzęckaSkomentuj
Sztuczna inteligencja uczy się grać w Mario. Zobacz jej postępy na TikToku

TikTok to miejsce publikowania nagrań wideo z przeróżnych, często głupich wyzwań, ale nie tylko. W platformie tej można też znaleźć filmiki edukacyjne, a także z zabawnymi zwierzętami czy memami. Można tam też oglądać transmisje na żywo, a bohaterką jednej z nich jest sztuczna inteligencja, która uczy się grać w Mario.



AI gra w Mario na TikToku

Właściwie od kilku tygodni różne konta na TikToku prowadzą transmisje na żywo, w ramach których różne boty AI uczą się grania w Super Mario World. Jednym z tych, które radzą sobie ze słynną grą Nintendo lepiej, jest bot o nazwie Rupert. Rupert już wkrótce pokona bowiem składający się z siedmiu poziomów pierwszy świat gry.

W jaki sposób Rupert uczy się grania w Mario? Dokładnie tak, jak w Mario gramy my, ludzie – grając do porażki i próbując w kółko, i w kółko, aż dojdzie jeszcze dalej niż dotąd. Rupert potrafi wielokrotnie powtarzać te same błędy, ale z czasem ewoluuje i staje się coraz lepszym graczem.



Sztuczna inteligencja inspirowana ewolucją

Rupert posiada jeden cel – dostać się na drugi koniec poziomu. Wie, jakie przyciski może naciskać i widzi, co dzieje się na ekranie. Co ciekawe, to co on widzi my możemy zobaczyć w lewym górnym rogu transmisji. W przeciwieństwie do człowieka sztuczna inteligencja nie mogła jednak tak po prostu założyć, czego na ekranie unikać, a czego nie. Dopiero z czasem uczy się, co prowadzi do sukcesu, a co do porażki.

Warto jeszcze wspomnieć, że Rupert w pewnym sensie naśladuje mechanizmy doboru naturalnego i wykorzystuje „gatunki” oraz „pokolenia”. Podczas każdego „pokolenia” sztuczna inteligencja wypróbowuje określoną strategie dla każdego „gatunku”, poświęcając temu od dwóch do sześciu serii. Co 50 – 100 gatunków sztuczna inteligencja segreguje to czego się nauczyła i tworzy nowe „pokolenie”.

Gdy sztuczna inteligencja gra w Super Mario World, oceniana jest jej „kondycja”. Wartość „kondycji” jest tym większa, im dalej Rupert jest w stanie dotrzeć na konkretnym poziomie i im szybciej jest w stanie to zrobić. Co więcej, „pokolenia” o najwyższej kondycji są wybierane, by je ze sobą łączyć. Powstają w ten sposób nowe „pokolenia”, o jeszcze wyższym stopniu wyrafinowania i radzące sobie z grą jeszcze lepiej.

Opisana metoda działa powoli, ale działa. Dzięki niej sztuczna inteligencja faktycznie uczy się grać w Mario. Pokonanie pierwszego poziomu Super Mario World zajęło Rupertowi zaledwie 57 pokoleń. To rzecz jasna wywołało radość na czacie wśród użytkowników TikToka.


polecane wideo - obserwuj nas na YouTube



Rozwiązane opracowane wcześniej, niż mogłoby się wydawać

Warto wspomnieć, że Rupert bazuje na programie MarI/O stworzonym przez programistę i streamera o pseudonimie SethBling. MarI/O powstał lata temu, ale teraz, w dobie popularności zaawansowanej sztucznej inteligencji takiej jak ChatGPT cieszy się szczególnie dużym zainteresowaniem.

Rupert i MarI/O to rzecz jasna algorytmy znacznie mniej skomplikowane niż czatboty takie jak ChatGPT. Mimo to są równie ciekawe.

Źródło: Gizmodo, fot. tyt. Canva

Anna BorzęckaSwoją przygodę z dziennikarstwem rozpoczęła w 2015 roku. Na co dzień pisze o nowościach ze świata technologii i nauki, ale jest również autorką felietonów i recenzji. Chętnie testuje możliwości zarówno oprogramowania, jak i sprzętu – od smartfonów, przez laptopy, peryferia komputerowe i urządzenia audio, aż po małe AGD. Jej największymi pasjami są kulinaria oraz gry wideo. Sporą część wolnego czasu spędza w World of Warcraft, a także przyrządzając potrawy z przeróżnych zakątków świata.