Wrzucasz zdjęcie, wychodzi film. Gemini ze świetną nowością

Piotr MalinowskiSkomentuj
Wrzucasz zdjęcie, wychodzi film. Gemini ze świetną nowością

Gemini zyskało kolejną przydatną aktualizację. Użytkownicy mogą teraz przemienić statyczne zdjęcie w materiał wideo. Zostanie ono automatycznie wzbogacone o efekty dźwiękowe, a nawet dialogi. Nowość ma ogromny potencjał, choć nie brakuje kilku ograniczeń. Mowa bowiem o generowaniu dosyć krótkich (kilkusekundowych) klipów, lecz to zapewne wyłącznie tymczasowy stan rzeczy. Amerykański koncern informuje też o konieczności opłacania dosyć drogiej subskrypcji.



Gemini ożywi zdjęcia, które mu podeślesz

Trzeba przyznać, że ostatnie miesiące obfitują w przydatne rozwiązania napędzane przez sztuczną inteligencję. Ostatnio informowaliśmy chociażby o opcji analizowania filmików. Gemini jest w stanie rozwiązać szereg problemów dotyczących np. nieprawidłowego działania pojazdu lub innego sprzętu elektronicznego. To znacznie bardziej kompleksowe narzędzie, gdyż nie polega tylko na suchym tekstowym zleceniu.

Google poinformowało, że najnowsza funkcja napędzana jest przez najnowszy model Veo 3 i jej zasada działania należy do stosunkowo prostych. Dochodzi do transformacji wrzuconych zdjęć w maksymalnie 8-sekundowe materiały wideo. Dopełniane są one generowaną ścieżką dźwiękową składającą się z m.in. szumów otoczenia oraz mowy. Zadowoleni będą (przynajmniej na razie) subskrybenci pakietów AI Ultra oraz Pro zamieszkujący wybrane regiony. Koniecznie zatem sprawdźcie czy aktualizacja trafiła do Polski.



Gemini (Android) – sprawdź dostępność nowości

Docelowo pojawi się ona wewnątrz przeglądarkowej, jak i mobilnej wersji popularnego asystenta. Jeśli zaś chodzi o jakość wypluwanych materiałów wideo, to pozostawia ona sporo do życzenia. Klipy zostaną dostarczone do użytkownika w formie plików MP4, których maksymalna rozdzielczość wynosi 720p. Google daje też znać o opcji załączenia tekstowego promptu zawierającego szczegółowe prośby. Nic nie stoi na przeszkodzie, by wzbogacić nagranie o audiodeskrypcję.

Poniżej możecie natomiast zobaczyć przykład zastosowania wprowadzonego właśnie rozwiązania. Robi spore wrażenie, prawda?

Wykonano kolejny krok w stronę istotnego przełomu

Amerykański gigant wspomniał również o oczywistym elemencie. Każdy wygenerowany klip wideo opatrzony będzie widocznym i niewidocznym znakiem wodnym. Użytkownicy będą zatem wiedzieć, że patrzą na coś stworzonego przez sztuczną inteligencję. Warto też wiedzieć, iż podobna funkcjonalność występuje wewnątrz narzędzia Flow. Właśnie trafiło ono do mieszkańców kilkudziesięciu kolejnych państw – Polska też znajduje się na liście.

Dostępność wewnątrz Gemini likwiduje jednak konieczność pobierania odrębnej aplikacji, co także należy uznać za bardzo dobrą wiadomość. Trudno natomiast stwierdzić czy Google kiedykolwiek postanowi udostępnić Veo 3 osobom nieopłacającym drogiej subskrypcji. Obecnie za opcję generowania klipów należy zapłacić około 100 zł miesięcznie.


Możliwość przekształcenia zdjęć w materiały wideo dostarcza sztucznej inteligencji dodatkowy kontekst oraz porcję istotnych danych. Filmiki powinny być więc jeszcze bardziej szczegółowe oraz naturalne.

Źródło: Google / Zdjęcie otwierające: Google

Piotr MalinowskiDziennikarz z pasji i wykształcenia. Jest związany z popularnymi serwisami branżowymi, gdzie od siedmiu lat publikuje treści o nowych technologiach, gamingu oraz „ludziach internetu”. Fascynuje go wpływ influencer marketingu na społeczeństwo oraz szeroko pojęte przyczyny i skutki nierówności społecznych. Prywatnie fan powieści/filmów grozy, gier studia Piranha Bytes, podcastów kryminalnych, dobrej kawy oraz rowerowych wycieczek.