image.png

Google a annoncé aujourd'hui le lancement de son dernier modèle d'intelligence artificielle, Gemini 2.0, son modèle IA le plus puissant à ce jour. Cette mise à niveau majeure représente non seulement une amélioration significative des performances, mais marque également une étape importante vers l'ère des agents d'intelligence artificielle.

Selon Sundar Pichai, PDG de Google et d'Alphabet, Gemini 2.0 a réalisé des progrès révolutionnaires en matière de capacités multimodales et d'utilisation d'outils natifs. Le nouveau modèle est capable non seulement de comprendre et de traiter des entrées sous diverses formes : texte, images, vidéos, audio, etc., mais il prend également en charge, pour la première fois, la génération d'images natives et des fonctionnalités de sortie multimodales telles que la conversion de texte en parole.

"Si Gemini 1.0 portait sur l'organisation et la compréhension de l'information, Gemini 2.0 vise à rendre l'information plus utile", a déclaré Pichai. Le modèle est actuellement accessible aux développeurs et aux testeurs de confiance.

Innovations technologiques et amélioration des performances

Demis Hassabis, PDG de Google DeepMind, a révélé que la première version publiée est Gemini 2.0 Flash, une version expérimentale. Cette version offre des performances considérablement améliorées tout en maintenant une faible latence. Il est à noter que 2.0 Flash surpasse même 1.5 Pro dans les tests de référence clés, avec une vitesse de réponse doublée.

Le nouveau modèle s'exécute sur la plateforme matérielle TPU Trillium de sixième génération de Google, l'infrastructure qui sous-tend la formation et l'inférence à 100 % de Gemini 2.0. Cette plateforme est désormais accessible aux clients.

image.png

Applications concrètes et intégration aux produits

Google prévoit d'intégrer rapidement Gemini 2.0 à son écosystème de produits. À partir d'aujourd'hui, les utilisateurs de Gemini dans le monde entier peuvent choisir d'utiliser la version expérimentale 2.0 Flash via la version web, et la version mobile sera bientôt disponible. De plus, la fonction d'aperçu IA de la recherche Google intégrera les capacités d'inférence avancées de 2.0 pour résoudre des problèmes plus complexes et à plusieurs étapes.

Il est également important de noter que Google a lancé une nouvelle fonctionnalité appelée "Deep Research", qui sera disponible dans Gemini Advanced. Cette fonctionnalité fonctionnera comme un assistant de recherche, explorant des sujets complexes et générant automatiquement des rapports.

Explorer l'avenir des agents IA

Lors de cette annonce, Google a également présenté plusieurs prototypes de recherche basés sur Gemini 2.0 :

  • Project Astra : un prototype d'assistant IA polyvalent, capable de conversations multilingues, utilisant des outils tels que la recherche Google, Lens et Maps, et disposant d'une mémoire de conversation de 10 minutes.
  • Project Mariner : un prototype d'interaction avec le navigateur, capable de comprendre et de raisonner les informations sur les pages web et d'aider les utilisateurs à accomplir des tâches via une extension Chrome. Il a obtenu les meilleurs résultats (83,5 %) lors du test de référence WebVoyager.
  • Jules : un agent de code IA destiné aux développeurs, qui peut être intégré directement au workflow GitHub pour aider à résoudre les problèmes et à exécuter des tâches.

Sécurité et développement responsable

Tout en faisant progresser ces innovations, Google souligne l'importance de la sécurité et du développement responsable. L'entreprise a mis en place plusieurs mesures pour garantir une utilisation sûre des agents IA :

  • Collaboration avec le Comité de responsabilité et de sécurité (RSC) pour identifier et comprendre les risques potentiels
  • Amélioration des méthodes d'équipe rouge assistées par l'IA pour améliorer l'évaluation et l'atténuation des risques
  • Mise en place de mécanismes d'évaluation et de formation de la sécurité pour les entrées et sorties multimodales
  • Intégration de mécanismes de protection contre les instructions malveillantes dans Project Mariner

Perspectives d'avenir

Le lancement de Gemini 2.0 est considéré comme une étape importante dans le développement de l'IA. En combinant des capacités multimodales avancées et des fonctionnalités d'agent, Google démontre son ambition de faire progresser la technologie de l'IA. Au fur et à mesure que ces nouvelles fonctionnalités seront intégrées aux différents produits, les utilisateurs pourront bénéficier d'assistants IA plus intelligents et plus pratiques.

Cependant, Google reconnaît que la technologie des agents IA en est encore à ses débuts et qu'il est nécessaire de continuer à recueillir des commentaires auprès de testeurs de confiance pour améliorer et perfectionner cette technologie. L'entreprise s'engage à poursuivre le développement de la technologie de l'IA de manière responsable, en explorant de nouvelles possibilités tout en garantissant la sécurité et le respect des normes éthiques.

Pour plus d'informations, veuillez consulter : https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents