Gemini z przełomową nowością. AI otrzyma kolejny zmysł: wzrok

Piotr MalinowskiSkomentuj
Gemini z przełomową nowością. AI otrzyma kolejny zmysł: wzrok

Gemini Live już wkrótce zyska przełomową aktualizację. Wprowadzi ona dwie funkcje dla osób korzystających z płatnego planu. Sztuczna inteligencja będzie chociażby w stanie wykorzystać kamerę smartfona, by podejrzeć zewnętrzny świat – dzięki temu użytkownicy zyskają szereg dodatkowych możliwości. Do tego dochodzi sposobność udostępnienia zawartości ekranu, by AI dostała jeszcze więcej kontekstu. To również powinno przyczynić się do zwiększenia skuteczności narzędzia ze stajni technologicznego giganta.



Gemini Live w końcu zobaczy zewnętrzny świat

Zaledwie kilka dni temu Gemini stało się jeszcze lepsze dla bezpłatnych użytkowników. Drogą subskrypcję opuściła funkcja nosząca nazwę Saved Info. Umożliwia ona zapamiętywanie zainteresowań internautów, a także ich preferencji dotyczących przedmiotów czy innych aspektów. Tym samym osobisty asystent łatwiej dostosowuje odpowiedzi do klienta – znika też konieczność nieustannego powtarzania faktów przewijających się w poprzednich konwersacjach.

Teraz przyszedł czas na kolejny update, lecz tym razem dotyczący wyłącznie członków subskrypcji Advanced. Podczas trwających targów MWC 2025 zaprezentowano dwie nowości, które w przeciągu kilku najbliższych tygodni powinny trafić do klientów. Aktualizacja uczyni usługę jeszcze bardziej interaktywną oraz świadomą kontekstu przekazywanych treści.



Gemini (Android) – pobierz aplikację z naszej bazy danych

Pierwsza funkcjonalność to tak naprawdę wyposażenie Gemini w kolejny zmysł: wzrok. Asystent uzyska bezpośredni dostęp do kamery naszego smartfona. Użytkownicy będą mogli skierować obiektyw na dowolny obiekt, otoczenie czy nawet ekran komputera. Sztuczna inteligencja przeanalizuje wtedy to, co widzi i wygeneruje stosowną odpowiedź. Internauci poproszą o m.in. identyfikację przedmiotu, wytłumaczenie problemu technicznego oraz jego rozwiązanie. To kolejny krok w kierunku uczynienia usługi czymś więcej niż standardowym chatbotem.

Asystent przechwyci ekran i wyda wyrok

Poniżej natomiast możecie zobaczyć działanie drugiego rozwiązania. Mowa o możliwości udostępnienia ekranu tak, by Gemini Live widziało jego zawartość w czasie rzeczywistym. AI będzie dzięki temu w stanie pomóc w wykonaniu poszczególnych zadań, a także wygenerować wskazówki dotyczące np. konkretnej aplikacji. Poprosimy również o podsumowanie wyświetlanego tekstu bądź jakiejkolwiek innej treści. Trzeba przyznać, że na materiale poglądowym funkcja prezentuje się naprawdę ciekawie.

Niestety trudno stwierdzić, kiedy powyżej opisane nowości staną się dostępne dla wszystkich użytkowników. Jeszcze w marcu trafią do osób opłacających subskrypcję Advanced. Zapewne za kilka miesięcy aktualizacja zostanie udostępniona bezpłatnym klientom, choć oczywiście realizacja tego scenariusza nie jest przesądzona.

Trzeba przyznać, że ostatnimi czasy Google robi wszystko, by użytkownicy zaczęli korzystać z Gemini – zarówno na smartfonach z Androidem, jak i systemem iOS.


Źródło: Google / Zdjęcie otwierające: Google

Piotr MalinowskiDziennikarz z pasji i wykształcenia. Jest związany z popularnymi serwisami branżowymi, gdzie od siedmiu lat publikuje treści o nowych technologiach, gamingu oraz „ludziach internetu”. Fascynuje go wpływ influencer marketingu na społeczeństwo oraz szeroko pojęte przyczyny i skutki nierówności społecznych. Prywatnie fan powieści/filmów grozy, gier studia Piranha Bytes, podcastów kryminalnych, dobrej kawy oraz rowerowych wycieczek.