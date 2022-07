Ma tłumaczyć ich jeszcze więcej.

Lepsze tłumaczenia dzięki technologii

„Kilka języków – w tym angielski, mandaryński, hiszpański i arabski – dominuje w Internecie.”

„Native speakerzy tych bardzo powszechnie używanych języków rzadko zdają sobie sprawę z tego, jakim przywilejem jest możliwość czytania czegoś w swoim ojczystym języku. NLLB pomoże większej liczbie osób czytać treści w ich preferowanym języku, zamiast zawsze korzystać z języka pośredniego, który często powoduje, że sens tekstu jest zniekształcony lub zgubiony.”

Rezultat pokonania licznych przeszkód

Większość światowej populacji posługuje się kilkudziesięcioma językami, z których najbardziej popularne są mandaryński, hindi, hiszpański, angielski, arabski i portugalski. W sumie istnieje jednak ponad 7100 języków, które są w użyciu dzisiaj. Rzecz jasna, nie istnieje osoba, która znałaby je wszystkie.Póki co nie istnieje też algorytm, który znałby wszystkie języki świata, ale Meta chce to zmienić. Sześć miesięcy temu firma rozpoczęła realizację projektu NLLB (No Language Left Behind), którego celem jest wytrenowanie sztucznej inteligencji zdolnej do dokonywania tłumaczeń między przeróżnymi językami z całego świata bez konieczności tłumaczenia po drodze na język angielski. Teraz Meta podzieliła się pierwszym kamieniem milowym projektu. Jej sztuczna inteligencja posługuje się już biegle 200 językami.Wspomniane 200 języków obejmuje wiele języków afrykańskich i języków azjatyckich, z istnienia których mnóstwo ludzi zapewne nie zdaje sobie sprawy. Przykłady takich języków to Lao i Kamba.Meta chwali się, że jej sztuczna inteligencja – NLLB-200 oferuje w przypadku obsługiwanych języków tłumaczenia o jakości o 44 procent wyższej niż inne podobne modele. W przypadku niektórych języków afrykańskich i języków używanych w Indiach poziom tłumaczeń był o 70 procent wyższy., zauważa Meta w swoim komunikacie.Dokonywanie tłumaczeń między dwoma językami – zwłaszcza jeśli żaden z tych języków nie jest językiem angielskim - potrafi być dla modeli sztucznej inteligencji bardzo trudne. To po części dlatego, że modele te z reguły uczą się tłumaczenia w oparciu o dane z Internetu. Jak wiadomo, w Internecie nie trudno o treści (tekstowe i głosowe) w języku angielskim, hiszpańskim czy mandaryńskim, ale już zdecydowanie trudniej o treści w takich językach jak Fan czy Kikuyu.Również sztuczna inteligencja Meta uczy się kolejnych języków i dokonywania tłumaczeń z danych dostępnych w Internecie. Niemniej, Meta opracowała rozwiązania, takie jak systemy ccMatrix i ccAligned, które usprawniły pozyskiwanie tych danych, jak również proces treningu modelu komputerowego.