Google a récemment lancé deux nouvelles fonctionnalités importantes pour son assistant d'intelligence artificielle Gemini : Canvas, un espace de travail collaboratif, et Audio Overviews, un résumé audio, améliorant ainsi l'utilité et l'expérience utilisateur de son assistant IA.

Canvas : création de documents en collaboration en temps réel

La fonction Canvas offre aux utilisateurs un espace de travail interactif leur permettant de collaborer avec l'IA pour créer des documents et du code. Cette fonction affiche les modifications en temps réel et permet aux utilisateurs de discuter des modifications via une interface de chat intégrée.

Il est particulièrement intéressant de noter que Canvas peut générer un aperçu instantané du code HTML et React, et que les documents terminés peuvent être exportés directement vers Google Docs. Les analyses du secteur indiquent que cette fonctionnalité est assez similaire à celle lancée par ChatGPT sous le même nom à l'automne dernier.

Audio Overviews : transformer du texte en audio conversationnel

La fonction Audio Overviews permet aux utilisateurs de convertir des contenus écrits tels que des documents, des présentations et des rapports de recherche en dialogues de type podcast, analysés et discutés par deux présentateurs IA.

Google présente cette technologie en convertissant la sortie de sa fonction de recherche approfondie gratuite mise à jour en podcast audio IA. Ces résumés audio sont initialement apparus sur la plateforme NotebookLM. Il est important de noter que, comme pour tout contenu généré par l'IA, ces contenus audio peuvent contenir des informations inexactes. Les utilisateurs doivent faire preuve de discernement.

Actuellement, la fonction Audio Overviews est uniquement disponible en anglais et accessible via le Web et les plateformes mobiles. Les utilisateurs peuvent télécharger et partager les fichiers audio créés.

L'écosystème Gemini continue de s'étendre

Depuis le début de l'année, Google développe activement son écosystème Gemini. Les dernières mises à jour incluent :

  • Gemini Live a ajouté la prise en charge de la vidéo et du partage d'écran, lancée en avant-première sur les appareils Samsung Galaxy S24/S25 et Pixel 9
  • Google prévoit de remplacer Google Assistant par Gemini comme assistant IA par défaut sur Android
  • Lancement de trois nouvelles variantes de modèles : Gemini 2.0 Flash (modèle de base), Flash Lite (version économique) et 2.0 Pro (avec capacité de traitement de contexte étendue)
  • En dehors de l'UE, de la Suisse et du Royaume-Uni, Gemini peut désormais accéder à l'historique de recherche Google des utilisateurs, offrant des réponses plus contextuelles
  • La plateforme a acquis des fonctionnalités multimodales natives pour générer et éditer des images et comprendre les vidéos YouTube

Selon Google, les fonctions Canvas et Audio Overviews sont désormais disponibles pour tous les utilisateurs de Gemini et Gemini Advanced dans le monde.