OpenAI hat die lang erwartete Videochat- und Bildschirmfreigabefunktion in seinem Premium-Sprachmodus angekündigt.

Diese neue Funktion ist jetzt für ChatGPT Teams-, Plus- und Pro-Nutzer in den iOS- und Android-Mobil-Apps verfügbar. Für ChatGPT Enterprise- und Education-Abonnenten wird sie voraussichtlich im Januar nächsten Jahres ausgerollt. Nutzer aus der EU, der Schweiz, Island, Norwegen und Liechtenstein haben jedoch keinen Zugriff auf diesen Premium-Sprachmodus.

image.png

OpenAI erwähnte diese Funktion erstmals im Mai dieses Jahres, als das Unternehmen zeigte, wie GPT-4o ein Spiel „beobachten“ und den Spielverlauf erklären konnte. Der Premium-Sprachmodus wurde dann im September offiziell eingeführt. Über eine neue Schaltfläche im Premium-Sprachmodus können Benutzer Videoanrufe starten, ähnlich wie bei FaceTime. ChatGPT kann dabei in Echtzeit auf die im Video gezeigten Inhalte reagieren.

In einer OpenAI-Demo half ChatGPT einem Benutzer mithilfe der Videofunktion, Kaffee zuzubereiten. Es konnte Kaffeeausrüstung erkennen, den Benutzer anweisen, wann er Filterpapier einlegen sollte, und das Ergebnis bewerten. Darüber hinaus konnte sich ChatGPT an die Person erinnern, die sich vorgestellt hatte, was eine höhere Interaktivität zeigt. Diese Art der Videointeraktion ähnelt dem kürzlich von Google vorgestellten Project Astra, das ebenfalls Fragen zu gesehenen Objekten in einem Videochat beantworten kann, z. B. die Identifizierung von Skulpturen auf einer Londoner Straße.

Die Bildschirmfreigabefunktion ermöglicht es ChatGPT, über die App hinaus in die Browserumgebung zu gelangen. Benutzer können die Bildschirmfreigabe über das Dreipunkt-Menü öffnen, eine App auf ihrem Telefon öffnen und ChatGPT nach dem Gesehenen fragen. In einer Demo aktivierten OpenAI-Forscher die Bildschirmfreigabe, öffneten dann eine Messaging-App und baten ChatGPT, bei der Beantwortung einer Foto-Nachricht zu helfen.

Die Bildschirmfreigabefunktion von ChatGPT ähnelt jedoch ähnlichen Funktionen, die kürzlich von Microsoft und Google eingeführt wurden. Letzte Woche stellte Microsoft eine Vorschauversion von Copilot Vision vor, die es Pro-Abonnenten ermöglicht, während des Surfens im Web einen Copilot-Chat zu öffnen, um Fotos auf Webseiten zu erkennen oder bei einem Karten-Ratespiel zu helfen. Googles Project Astra kann auch auf ähnliche Weise Browserinhalte lesen.

Zusätzlich hat OpenAI einen unterhaltsamen „Weihnachtsmann-Modus“ eingeführt, in dem Benutzer mit einem ChatGPT interagieren können, das die Stimme des Weihnachtsmanns imitiert.

image.png

Im Gegensatz zu den Einschränkungen der neuen Funktionen ist der „Weihnachtsmann-Modus“ in der mobilen App, der Webversion und den Windows- und MacOS-Apps bis Anfang Januar nächsten Jahres verfügbar. Beachten Sie, dass Chats mit dem Weihnachtsmann nicht in der Chat-Historie gespeichert werden und die Erinnerungsfunktion von ChatGPT nicht beeinträchtigen.

Wichtigste Punkte:

🎥 Neue Videochat-Funktion: ChatGPT reagiert in Echtzeit auf die vom Benutzer gesehenen Inhalte.

🖥️ Bildschirmfreigabefunktion: Benutzer können ChatGPT auf ihrem Telefon um Hilfe bitten.

🎅 „Weihnachtsmann-Modus“: Benutzer können mit einem ChatGPT interagieren, das die Stimme des Weihnachtsmanns imitiert.