Nowe narzędzia AI od Google zdziałają cuda. Oto co potrafią

Piotr MalinowskiSkomentuj
Nowe narzędzia AI od Google zdziałają cuda. Oto co potrafią

Google poinformowało o zaktualizowaniu swoich produktów wykorzystujących sztuczną inteligencję. Wdrożono przede wszystkim kolejne iteracje generatorów zdjęć oraz wideo. Mamy więc do czynienia z debiutem Veo 2 oraz usprawnieniu modelu Imagen 3. Do tego wszystkiego dochodzi usługa Whisk pozwalająca przekształcić istniejącą już grafikę.



Google kusi nowymi usługami AI

Dopiero co dawaliśmy Wam znać o wprowadzeniu ogromnej aktualizacji do popularnego asystenta. Gemini 2.0 zagościł w wersji eksperymentalnej u większości konsumentów. Uzyskiwane odpowiedzi mają być nie tylko skuteczniejsze, ale i rozumiejące głębszy kontekst. Wielkimi krokami zbliżają się również osobiści agenci specjalizujący się w wykonywaniu określonych zadań.

Zacznijmy może od zupełnie nowego narzędzia. Nosi ono nazwę Whisk i pozwala generować grafiki, lecz nie na podstawie tekstowych promptów. Wykorzystamy do tego inne obrazy, co powinno ułatwić cały proces oraz skuteczniej wyrazić nasze potrzeby. Oczywiście nic nie stoi na przeszkodzie, by wskazać styl, temat oraz inne szczegóły, które powinny być brane pod uwagę przez sztuczną inteligencję.



Tak wygenerowaną grafikę możemy oczywiście pobrać. Użytkownicy są też w stanie dopracowywać tego typu dzieła – nawet po zakończonym procesie. Użyjemy do tego specjalne pole tekstowe, by wskazać AI kierunek, który powinna obrać przy przekształcaniu obrazu. Mówimy tak naprawdę o narzędziu skierowanym do początkujących lub osób poszukujących dobrej i niezobowiązującej zabawy. Google samo opisuje Whisk jako coś do „błyskawicznej eksploracji wizualnej”. Dlatego też mogą występować pewne błędy oraz niedociągnięcia.

Veo 2 i ulepszony model Imagen 3

Narzędzie wykorzystuje najnowszy model językowy Imagen 3, który zresztą też otrzymał sporą aktualizację. Technologiczny gigant daje znać o generowaniu jaśniejszych oraz lepiej skomponowanych obrazów. Zadowoleni będą użytkownicy bawiący się przeróżnymi stylami artystycznymi – grafiki je wykorzystujące powinny stać się jeszcze dokładniejsze. Sztuczna inteligencja ponadto jeszcze wierniej podąży za wskazówkami gwarantując bogatsze szczegóły i wyraźniejsze tekstury.

Nie można również przejść obojętnie obok Veo 2, czyli kolejnej iteracji generatora wideo. Google chwali się przede wszystkim lepszym rozumieniem fizyki świata rzeczywistego oraz najróżniejszych niuansów ludzkich ruchów. Dlatego też tworzone materiały powinny przedstawiać znacznie pokaźniejszą liczbę szczegółów i cechować się większym realizmem.

Konsumenci mogą też prosić Veo 2 o wygenerowanie klipu w określonym gatunku i wzbogaconego o konkretne efekty. Wtedy też otrzymamy filmik w rozdzielczości 4K i trwający nawet kilka minut. Przeszkodą nie powinno być wskazanie konkretnych scen czy sposoby przedstawienia wybranego ujęcia. Jeśli zechcemy, by AI skupiło się na jednym elemencie, to reszta zostanie stosownie rozmazana. Do tego dochodzi minimalna szansa na wygenerowanie niechcianych artefaktów czy efektu halucynacji. Udostępniony przez Google materiał robi wrażenie.

Trzeba przyznać, że grudzień jest dla zwolenników sztucznej inteligencji iście obfitym miesiącem. Dopiero byliśmy świadkami zapowiedzi narzędzia Sora od OpenAI, a teraz Google zrzuciło kilka długo oczekiwanych bomb.


Źródło: Google / Zdjęcie otwierające: Google

Piotr MalinowskiDziennikarz z pasji i wykształcenia. Jest związany z popularnymi serwisami branżowymi, gdzie od siedmiu lat publikuje treści o nowych technologiach, gamingu oraz „ludziach internetu”. Fascynuje go wpływ influencer marketingu na społeczeństwo oraz szeroko pojęte przyczyny i skutki nierówności społecznych. Prywatnie fan powieści/filmów grozy, gier studia Piranha Bytes, podcastów kryminalnych, dobrej kawy oraz rowerowych wycieczek.