OpenAI a annoncé l'ajout très attendu des fonctionnalités de chat vidéo et de partage d'écran à son mode vocal avancé.
Cette nouvelle fonctionnalité est désormais disponible pour les utilisateurs de ChatGPT Teams, Plus et Pro sur les applications mobiles iOS et Android. Son déploiement auprès des abonnés ChatGPT Entreprise et Éducation est prévu pour janvier prochain. Cependant, les utilisateurs de l'Union européenne, de la Suisse, de l'Islande, de la Norvège et du Liechtenstein ne pourront pas accéder à ce mode vocal avancé.
OpenAI avait mentionné cette fonctionnalité pour la première fois en mai dernier, en démontrant comment GPT-4 pouvait « regarder » un jeu et en expliquer le déroulement. Le mode vocal avancé a ensuite été officiellement lancé en septembre. Les utilisateurs peuvent démarrer un appel vidéo via un nouveau bouton à l'écran, similaire à FaceTime, permettant à ChatGPT de répondre en temps réel au contenu affiché dans la vidéo.
Lors d'une démonstration d'OpenAI, ChatGPT a aidé un utilisateur à préparer un café via la fonction vidéo. Il a pu identifier les ustensiles, guider l'utilisateur sur le moment d'insérer le filtre et évaluer le résultat. De plus, ChatGPT a pu se souvenir de la personne qui s'était présentée, démontrant une interactivité accrue. Cette interaction vidéo est similaire au récent Project Astra de Google, qui permet également de répondre aux questions de l'utilisateur sur les objets visibles lors d'un chat vidéo, comme identifier une sculpture dans les rues de Londres.
La fonctionnalité de partage d'écran permet à ChatGPT de dépasser les limites de l'application et d'accéder à l'environnement du navigateur. Il suffit d'ouvrir le partage d'écran via le menu à trois points pour ouvrir une application sur son téléphone et demander de l'aide à ChatGPT sur ce qu'il voit. Dans une démonstration, les chercheurs d'OpenAI ont activé le partage d'écran, puis ont ouvert une application de messagerie pour demander à ChatGPT de l'aider à répondre à un message contenant une photo.
Cependant, la fonctionnalité de partage d'écran de ChatGPT présente des similitudes avec les fonctionnalités récemment lancées par Microsoft et Google. La semaine dernière, Microsoft a lancé une version préliminaire de Copilot Vision, permettant aux abonnés Pro d'ouvrir une conversation Copilot lors de la navigation sur le web, pour identifier des photos sur une page web ou pour jouer à un jeu de devinettes sur une carte. Le Project Astra de Google peut également lire le contenu du navigateur de manière similaire.
De plus, OpenAI a lancé un amusant mode « Père Noël », permettant aux utilisateurs de converser avec un ChatGPT imitant la voix du Père Noël.
Contrairement aux restrictions d'utilisation des nouvelles fonctionnalités, le mode « Père Noël » est disponible sur les applications mobiles, la version web et les applications Windows et MacOS jusqu'au début janvier prochain. Il est important de noter que les conversations avec le Père Noël ne seront pas enregistrées dans l'historique des discussions et n'affecteront pas la mémoire de ChatGPT.
Points clés :
🎥 Fonctionnalité de chat vidéo ajoutée, ChatGPT répond en temps réel au contenu visible par l'utilisateur.
🖥️ Fonctionnalité de partage d'écran disponible, permettant aux utilisateurs de demander de l'aide à ChatGPT sur leur téléphone.
🎅 Mode « Père Noël » disponible, permettant aux utilisateurs d'interagir avec un ChatGPT imitant la voix du Père Noël.