Póki co nie istnieje też algorytm, który znałby wszystkie języki świata, ale Meta chce to zmienić. Sześć miesięcy temu firma rozpoczęła realizację projektu NLLB (No Language Left Behind), którego celem jest wytrenowanie sztucznej inteligencji zdolnej do dokonywania tłumaczeń między przeróżnymi językami z całego świata bez konieczności tłumaczenia po drodze na język angielski. Teraz Meta podzieliła się pierwszym kamieniem milowym projektu. Jej sztuczna inteligencja posługuje się już biegle 200 językami.
Lepsze tłumaczenia dzięki technologii
Wspomniane 200 języków obejmuje wiele języków afrykańskich i języków azjatyckich, z istnienia których mnóstwo ludzi zapewne nie zdaje sobie sprawy. Przykłady takich języków to Lao i Kamba.
Meta chwali się, że jej sztuczna inteligencja – NLLB-200 oferuje w przypadku obsługiwanych języków tłumaczenia o jakości o 44 procent wyższej niż inne podobne modele. W przypadku niektórych języków afrykańskich i języków używanych w Indiach poziom tłumaczeń był o 70 procent wyższy.
„Kilka języków – w tym angielski, mandaryński, hiszpański i arabski – dominuje w Internecie.”, zauważa Meta w swoim komunikacie. „Native speakerzy tych bardzo powszechnie używanych języków rzadko zdają sobie sprawę z tego, jakim przywilejem jest możliwość czytania czegoś w swoim ojczystym języku. NLLB pomoże większej liczbie osób czytać treści w ich preferowanym języku, zamiast zawsze korzystać z języka pośredniego, który często powoduje, że sens tekstu jest zniekształcony lub zgubiony.”
Rezultat pokonania licznych przeszkód
Dokonywanie tłumaczeń między dwoma językami – zwłaszcza jeśli żaden z tych języków nie jest językiem angielskim – potrafi być dla modeli sztucznej inteligencji bardzo trudne. To po części dlatego, że modele te z reguły uczą się tłumaczenia w oparciu o dane z Internetu. Jak wiadomo, w Internecie nie trudno o treści (tekstowe i głosowe) w języku angielskim, hiszpańskim czy mandaryńskim, ale już zdecydowanie trudniej o treści w takich językach jak Fan czy Kikuyu.
Również sztuczna inteligencja Meta uczy się kolejnych języków i dokonywania tłumaczeń z danych dostępnych w Internecie. Niemniej, Meta opracowała rozwiązania, takie jak systemy ccMatrix i ccAligned, które usprawniły pozyskiwanie tych danych, jak również proces treningu modelu komputerowego.
Meta rzecz jasna dąży do tego, aby jej sztuczna inteligencja znalazła liczne zastosowania. Dlatego sprawiła, że NLLB-200 jest modelem otwartoźródłowym oraz przeznaczyła 200 tysięcy dolarów w postaci grantów dla organizacji non-profit w celu opracowania tych zastosowań. Kto wie, być może w przyszłości to ją Meta będzie wykorzystywać do tłumaczenia treści w swoich serwisach społecznościowych takich jak Facebook czy Instagram. Można też wyobrazić ją sobie chociażby jako tłumacz napisów do filmów i seriali.
Źródło: Meta, fot. tyt. Canva