Google poinformowało o zaktualizowaniu swoich produktów wykorzystujących sztuczną inteligencję. Wdrożono przede wszystkim kolejne iteracje generatorów zdjęć oraz wideo. Mamy więc do czynienia z debiutem Veo 2 oraz usprawnieniu modelu Imagen 3. Do tego wszystkiego dochodzi usługa Whisk pozwalająca przekształcić istniejącą już grafikę.
Google kusi nowymi usługami AI
Dopiero co dawaliśmy Wam znać o wprowadzeniu ogromnej aktualizacji do popularnego asystenta. Gemini 2.0 zagościł w wersji eksperymentalnej u większości konsumentów. Uzyskiwane odpowiedzi mają być nie tylko skuteczniejsze, ale i rozumiejące głębszy kontekst. Wielkimi krokami zbliżają się również osobiści agenci specjalizujący się w wykonywaniu określonych zadań.
- Sprawdź także: Ten generator wideo zrobi furorę. Sora od OpenAI już działa
Zacznijmy może od zupełnie nowego narzędzia. Nosi ono nazwę Whisk i pozwala generować grafiki, lecz nie na podstawie tekstowych promptów. Wykorzystamy do tego inne obrazy, co powinno ułatwić cały proces oraz skuteczniej wyrazić nasze potrzeby. Oczywiście nic nie stoi na przeszkodzie, by wskazać styl, temat oraz inne szczegóły, które powinny być brane pod uwagę przez sztuczną inteligencję.
Tak wygenerowaną grafikę możemy oczywiście pobrać. Użytkownicy są też w stanie dopracowywać tego typu dzieła – nawet po zakończonym procesie. Użyjemy do tego specjalne pole tekstowe, by wskazać AI kierunek, który powinna obrać przy przekształcaniu obrazu. Mówimy tak naprawdę o narzędziu skierowanym do początkujących lub osób poszukujących dobrej i niezobowiązującej zabawy. Google samo opisuje Whisk jako coś do „błyskawicznej eksploracji wizualnej”. Dlatego też mogą występować pewne błędy oraz niedociągnięcia.
Veo 2 i ulepszony model Imagen 3
Narzędzie wykorzystuje najnowszy model językowy Imagen 3, który zresztą też otrzymał sporą aktualizację. Technologiczny gigant daje znać o generowaniu jaśniejszych oraz lepiej skomponowanych obrazów. Zadowoleni będą użytkownicy bawiący się przeróżnymi stylami artystycznymi – grafiki je wykorzystujące powinny stać się jeszcze dokładniejsze. Sztuczna inteligencja ponadto jeszcze wierniej podąży za wskazówkami gwarantując bogatsze szczegóły i wyraźniejsze tekstury.


Nie można również przejść obojętnie obok Veo 2, czyli kolejnej iteracji generatora wideo. Google chwali się przede wszystkim lepszym rozumieniem fizyki świata rzeczywistego oraz najróżniejszych niuansów ludzkich ruchów. Dlatego też tworzone materiały powinny przedstawiać znacznie pokaźniejszą liczbę szczegółów i cechować się większym realizmem.
Konsumenci mogą też prosić Veo 2 o wygenerowanie klipu w określonym gatunku i wzbogaconego o konkretne efekty. Wtedy też otrzymamy filmik w rozdzielczości 4K i trwający nawet kilka minut. Przeszkodą nie powinno być wskazanie konkretnych scen czy sposoby przedstawienia wybranego ujęcia. Jeśli zechcemy, by AI skupiło się na jednym elemencie, to reszta zostanie stosownie rozmazana. Do tego dochodzi minimalna szansa na wygenerowanie niechcianych artefaktów czy efektu halucynacji. Udostępniony przez Google materiał robi wrażenie.
- Przeczytaj również: Gemini zamówi za Ciebie jedzenie. Nadchodzą rewolucyjne zmiany
Trzeba przyznać, że grudzień jest dla zwolenników sztucznej inteligencji iście obfitym miesiącem. Dopiero byliśmy świadkami zapowiedzi narzędzia Sora od OpenAI, a teraz Google zrzuciło kilka długo oczekiwanych bomb.
Źródło: Google / Zdjęcie otwierające: Google