Auf dem diesjährigen Mobile World Congress (MWC) kündigte Google neue Funktionen für seinen Gemini-Assistenten an: Echtzeit-Videoanalyse und Bildschirmfreigabe. Google One AI Premium-Abonnenten mit Gemini Advanced erhalten als Erste Zugang zu diesen Funktionen, noch in diesem Monat.
Das Update verleiht Gemini Live zwei Kernfähigkeiten: Erstens die Echtzeit-Analyse von Videomaterial über eine externe Kamera und zweitens die Bildschirmfreigabe, die es dem KI-Assistenten ermöglicht, Informationen auf dem Benutzerhandy direkt zu interpretieren und Feedback zu geben. Durch diese Funktionen können Benutzer eine interaktivere visuelle Kommunikation mit der KI führen, beispielsweise um Objekte zu identifizieren, Bildschirm Inhalte zu analysieren oder Echtzeit-Vorschläge zu erhalten.
Die neuen Funktionen werden zunächst auf Android-Geräten und in mehreren Sprachen verfügbar sein. Google demonstrierte auf dem MWC die Integration dieser Funktionen in verschiedene Android-Geräte und festigte damit seine Wettbewerbsposition im Bereich der KI-Assistenten.
Dieses Update markiert auch einen entscheidenden Schritt der KI-Assistenten in Richtung Interaktion mit der realen Welt. Googles langfristiges Ziel ist Project Astra – ein universeller multimodaler KI-Assistent, der Text, Video und Audio in Echtzeit verarbeiten und über ein Kurzzeitgedächtnis verfügt. Astra soll zukünftig eng mit Google Suche, Lens und Maps integriert werden.
Mit der Einführung von Gemini Live verschärft sich der Wettbewerb zwischen Google und OpenAI. Seit Dezember letzten Jahres unterstützt ChatGPT Echtzeit-Video und Bildschirmfreigabe im erweiterten Sprachmodus. Googles Update ist eine direkte Antwort darauf. Ob Gemini mit dieser neuen Funktion seine führende Position im KI-Bereich weiter ausbauen kann, bleibt abzuwarten.