Google améliore Gemini 2.0 Flash Thinking : capacité de traitement de contextes longs accrue

Google a officiellement lancé le 22 janvier 2025 une version améliorée de son modèle d'inférence Gemini 2.0 Flash Thinking, reprenant ainsi la première place du Chatbot Arena. Cette mise à jour se concentre principalement sur l'amélioration de la gestion des contextes longs, prenant désormais en charge des entrées jusqu'à 1 million de jetons. Cela offre aux utilisateurs une capacité d'analyse plus approfondie lors du traitement de longs textes.

Jeff Dean, responsable de Google AI, a déclaré lors de la présentation que cette mise à jour expérimentale vise à améliorer la fiabilité du modèle et à réduire les contradictions entre le processus de réflexion du modèle et la réponse finale. Gemini 2.0 Flash Thinking conserve les avantages de la version précédente et ajoute une fonction d'inférence améliorée basée sur la pensée (thoughts), démontrant d'excellentes performances.

Sur le plan technique, Gemini 2.0 Flash Thinking a réalisé deux avancées majeures : premièrement, la capacité de traiter des contextes longs jusqu'à 1 million de jetons, essentielle pour les dialogues et les processus d'inférence complexes à plusieurs tours ; deuxièmement, une amélioration significative de l'autocorrection, permettant au modèle de maintenir la cohérence dans les conversations et d'utiliser de manière flexible les informations accumulées précédemment. Cela signifie que les utilisateurs peuvent profiter d'une interaction plus naturelle et cohérente avec le modèle.

Lors d'une démonstration, Jeff Dean a montré comment le modèle résolvait des problèmes de physique et expliquait son processus de raisonnement, impressionnant l'assistance. De plus, les participants ont indiqué que l'expérience réelle avec le nouveau modèle était encore plus rapide que lors de la démonstration.

Au-delà de la gestion des contextes longs, Gemini 2.0 Flash Thinking a également réalisé des progrès significatifs dans les tests de compétences mathématiques, scientifiques et d'inférence multimodale, avec une amélioration de 54 % en mathématiques en particulier. Ces excellentes performances laissent entrevoir un avenir prometteur pour ce modèle.

L'interface utilisateur sur la plateforme « Google AI Studio » offre un accès complet aux fonctionnalités du modèle, notamment la création d'invites, les conversations en temps réel et le développement d'applications. Bien que les fonctionnalités de l'interface actuelle soient quelque peu dispersées, Google prévoit de fournir un rapport technique plus détaillé et un guide utilisateur après le lancement officiel du modèle afin d'améliorer l'expérience utilisateur.

À l'avenir, l'équipe de développement de Google explore activement les capacités de traitement des données 3D, démontrant sa ferme volonté d'innover en permanence. On peut prévoir que la prochaine percée de Google dans le domaine de l'IA est imminente et mérite notre attention.

Lien d'essai : https://aistudio.google.com/prompts/new_chat

Actualités IA

Google améliore Gemini 2.0 Flash Thinking : capacité de traitement de contextes longs accrue

AIbase基地