Sztuczna inteligencja potrafi czytać z ruchu warg lepiej niż człowiek

Wojciech OnyśkówSkomentuj
Sztuczna inteligencja potrafi czytać z ruchu warg lepiej niż człowiek
Naukowcy z DeepMind (jedna z dywizji Google) wykorzystali sztuczną inteligencję do stworzenia najdokładniejszego oprogramowania do czytania z ruchów warg.

Wykorzystując sieć neuronową i technologię głębokiego uczenia się, naukowcy „nakarmili” sztuczną inteligencję tysiącami godzin programów telewizyjnych BBC. W ten sposób nauczyli ją poprawnie czytać z ruchu warg.

Skuteczność oprogramowania wynosi obecnie 46,8%. Dla porównania człowiek specjalizujący się w czytaniu z ust ten sam fragment zalicza z zaledwie 12,4-procentową skutecznością. Różnica jest zatem ogromna.

Podobne rozwiązanie stworzyli też naukowcy z Uniwersytetu Oksfordzkiego. W tym przypadku skuteczność sztucznej inteligencji wyniosła 93,4% w porównaniu do 52,3-procentowej skuteczności człowieka. Program był jednak testowany na specjalnie przygotowanym materiale szkoleniowym, podczas gdy algorytm DeepMind analizował rzeczywiste programy polityczne BBC.

Do wytrenowania sztucznej inteligencji wystarczyło 5 tys. godzin nagrań, w trakcie których wypowiedziano 118 tys. różnych zdań i 17,5 tys. unikalnych słów.

Rozwiązanie DeepMind może w przyszłości posłużyć do stworzenia aplikacji towarzyszącej dla osób głuchych i niedosłyszących. Dzięki niej będą oni w stanie zrozumieć sens toczącej się konwersacji.

Nieco bardziej podejrzliwi twierdzą natomiast, że technologia może zostać wykorzystana do skutecznego szpiegowania obywateli np. za pomocą systemu monitoringu miejskiego.

Źródło: The Verge

Udostępnij

Wojciech OnyśkówRedaktor w serwisie instalki.pl piszący o nowych technologiach i grach.