Wykorzystując sieć neuronową i technologię głębokiego uczenia się, naukowcy „nakarmili” sztuczną inteligencję tysiącami godzin programów telewizyjnych BBC. W ten sposób nauczyli ją poprawnie czytać z ruchu warg.
Skuteczność oprogramowania wynosi obecnie 46,8%. Dla porównania człowiek specjalizujący się w czytaniu z ust ten sam fragment zalicza z zaledwie 12,4-procentową skutecznością. Różnica jest zatem ogromna.
Podobne rozwiązanie stworzyli też naukowcy z Uniwersytetu Oksfordzkiego. W tym przypadku skuteczność sztucznej inteligencji wyniosła 93,4% w porównaniu do 52,3-procentowej skuteczności człowieka. Program był jednak testowany na specjalnie przygotowanym materiale szkoleniowym, podczas gdy algorytm DeepMind analizował rzeczywiste programy polityczne BBC.
Do wytrenowania sztucznej inteligencji wystarczyło 5 tys. godzin nagrań, w trakcie których wypowiedziano 118 tys. różnych zdań i 17,5 tys. unikalnych słów.
Rozwiązanie DeepMind może w przyszłości posłużyć do stworzenia aplikacji towarzyszącej dla osób głuchych i niedosłyszących. Dzięki niej będą oni w stanie zrozumieć sens toczącej się konwersacji.
Nieco bardziej podejrzliwi twierdzą natomiast, że technologia może zostać wykorzystana do skutecznego szpiegowania obywateli np. za pomocą systemu monitoringu miejskiego.
Źródło: The Verge