Google Translatotron to tłumacz symultaniczny rodem z przyszłości

Maksym SłomskiSkomentuj
Google Translatotron to tłumacz symultaniczny rodem z przyszłości
{reklama-artykul},
Translator Google to jedno z najpopularniejszych narzędzi w sieci umożliwiających wykonywanie szybkich tłumaczeń językowych. Możliwość translacji tekstu, tekstu na mowę i mowy na tekst w ponad 100 językach to niezwykle praktyczna funkcja, z której każdy z Was korzystał zapewne niejednokrotnie. I jeśli uważacie, że wprowadzona jakiś czas temu opcja tłumaczenia tekstu pisanego „na żywo”, przy wykorzystaniu głównego aparatu smartfonu, to ostatnie, co miało do powiedzenia w tej kwestii Google, jesteście w błędzie. Firma Google zaprezentowała właśnie na co stać nowego tłumacza o nazwie Translatotron.

Podstawowym zadaniem Translatotrona ma być translacja mowy na mowę nie tylko niemalże w czasie rzeczywistym, ale także z zachowaniem charakterystyki głosu osoby, której słowa są tłumaczone oraz fleksji. Nowy tłumacz dba nawet o takie detale, jak zachowanie tempa wypowiedzi danego rozmówcy. Jak to działa?

Google podaje, że Translatotron korzysta ze specjalnie zaprojektowanego modelu sieci sekwencyjnej. Narzędzie odbiera mowę, przetwarza ją do postaci spektrogramu (wykres widma amplitudowego dźwięku), a następnie tworzy nowy spektrogram w zadanym języku.

Google Translatotron 1

Zachowanie barwy głosu następuje dzięki opcjonalnemu dekoderowi, który nie działa jeszcze idealnie. Próbki dźwięku generowane są syntetycznie, przez co wciąż brzmią nieco „robotycznie”, ale odsłuchując je moglibyście bez problemu rozpoznać znanego Wam rozmówcę. Mnóstwo próbek językowych jest na bieżąco prezentowanych na stronie projektu w serwisie GitHub oraz blogu Google.

Translatotron nie jest jeszcze dostępny publicznie. Docelowo ma stać się częścią tłumacza Google, a z czasem trafi zapewne także jako tłumacz do komunikatorów Google.

Rozwój technologii generowania mowy i zaawansowane metody programowania otwierają przez ludzkością gigantyczne możliwości. Jakiś czas temu Agencja Informacyjna Xinhua z Chin stworzyła na przykład pierwszego wygenerowanego komputerowo prezentera wiadomości, którego przemówienie generowane było dzięki SI. Już teraz sztuczna inteligencja pozwala siać dezinformację – wystarczy skorzystać z oprogramowania Deepfake i naśladować czyjś głos, aby skutecznie wykorzystać oba narzędzia do manipulacji opinią publiczną. 

Źródło: Google

Udostępnij

Maksym SłomskiZ dziennikarstwem technologicznym związany od 2009 roku, z nowymi technologiami od dzieciństwa. Pamięta pakiety internetowe TP i granie z kumplami w kafejkach internetowych. Obecnie newsman, tester oraz "ten od TikToka". Miłośnik ulepszania swojego desktopa, czochrania kotów, Mazdy MX-5 i aktywnego uprawiania sportu. Wyznawca filozofii xD.