NVIDIA ogłosiło światu zupełnie nowy generator dźwięku AI. Nosi on nazwę Fugatto i teoretycznie pozwala na tworzenie dźwięków, melodii czy mowy wykorzystując wyłącznie wprowadzony przez użytkownika monit tekstowy. Istnieje więc szansa, że spod ręki sztucznej inteligencji wyjdzie coś, czego nigdy wcześniej w swoim życiu nie słyszeliście. Trochę czasu jednak minie zanim otrzymacie opcję skorzystania z usługi.
NVIDIA po raz kolejny zaskakuje sposobem wykorzystania AI
Regularnie możemy usłyszeć o nowościach ze stajni amerykańskiego producenta. Coraz więcej wiemy na temat nadchodzących kart graficznych – GeForce RTX 5090 może przede wszystkim zadziwić monstrualnie dużym GPU. Fani oprogramowania muszą natomiast wiedzieć, że aplikacja NVIDIA doczekała się stabilnej wersji. Poprzedni program odszedł tym samym na zasłużoną emeryturę.
Muzyczny edytor AI to dosyć interesujący projekt mający według producenta „tworzyć dźwięki, których nigdy wcześniej nie słyszano”. Jedyne, co musi zrobić użytkownik, to wpisać tekstowy prompt lub przesłać plik audio – później technologia zdziała cuda, choć obecnie niemalże nikt nie ma do niej dostępu. NVIDIA na szczęście udostępniła materiał poglądowy pozwalający przekonać się jak Fugatto działa w praktyce.
Punktem wyjścia ma być niespotykana do tej pory kreatywność. Nic więc nie stoi na przeszkodzie, by poprosić AI o wygenerowanie skomplikowanej melodii wykorzystującej saksofon, szczekanie i muzykę elektroniczną w jednym. Jeśli zaś chodzi o dźwięki, to powyższy klip sugeruje opcję stworzenia głębokich, dudniących impulsów basowych połączonych z przerywanym cyfrowym ćwierkaniem o wysokiej częstotliwości porównywalnym do uruchamiającej się potężnej i świadomej maszyny. Trudno to sobie nawet wyobrazić, a co dopiero wygenerować.
Niektóre funkcje generują obawy natury etycznej
To jednak nie koniec możliwości Fugatto. Narzędzie oferuje chociażby funkcję przekształcenia brzmienia głosu wybranej osoby. Za pomocą kilku kliknięć zmienimy akcent czy nadamy inny ton. NVIDIA pozwoli przy okazji odizolować wokal z przesłanej piosenki, dostosować jej melodię czy dodać tam dodatkowe instrumenty. Wszystko to działa za sprawą ogromnych zbiorów danych, które posłużyły do szkolenia sztucznej inteligencji. Mowa o milionach próbek audio.
Jeśli zaś chodzi o powszechną dostępność narzędzia, to tak naprawdę nic na ten temat nie wiadomo. Trudno w ogóle stwierdzić czy Fugatto kiedykolwiek trafi do użytku przeciętnych konsumentów. NVIDIA musiałaby oczywiście zadbać o aspekt prywatności, bezpieczeństwa oraz legalności. Dowolne przekształcanie czyjegoś głosu nie brzmi przecież zbyt etycznie.
- Przeczytaj również: NVIDIA wchodzi na rynek procesorów komputerowych. Ruszyło odliczanie
To bez wątpienia nie koniec wieści na temat AI od koncernu NVIDIA. Jest on niezwykle mocno zaangażowany w rozwój sztucznej inteligencji, co przekłada się na astronomiczne zyski i utrzymywanie pozycji lidera na rynku technologicznym.
Źródło: NVIDIA / Zdjęcie otwierające: unsplash.com (@arcreates)