2025 n'est pas encore arrivé, mais la bataille de l'IA dans la Silicon Valley a déjà commencé. Le PDG de Google, Sundar Pichai, a lancé un appel vibrant à tous les employés lors de la réunion stratégique annuelle : 2025 sera une année cruciale ! Il a souligné que Google devait progresser à une vitesse sans précédent, car il ne s'agit pas seulement d'une compétition technologique, mais d'un moment révolutionnaire pour l'avenir de l'IA.
Cette déclaration est sans aucun doute une réponse à la concurrence acharnée entre Google et OpenAI. Depuis l'arrivée de ChatGPT, la position de leader de Google dans le domaine de l'IA a été confrontée à des défis sans précédent. Au cours des deux dernières années, OpenAI a presque éclipsé tous les efforts de Google. Cependant, en décembre 2023, Google a effectué une remontée spectaculaire grâce à une série de produits phares tels que Gemini 2.0 Flash et Veo2, démontrant un potentiel dépassant les modèles leaders. Le tournant de cette course à l'IA semble être arrivé.

Lors de la réunion, Pichai a présenté un graphique comparatif des grands modèles, montrant que les performances de Gemini 1.5 étaient nettement supérieures à celles de ses concurrents, y compris OpenAI. Interrogé sur le fait que ChatGPT était devenu synonyme d'IA, Pichai a déclaré que Google n'avait pas besoin d'être toujours le premier, mais qu'il devait être le meilleur de sa catégorie. L'importance de 2025 réside dans le fait que Google doit consolider sa position parmi les leaders de l'IA. Logan Kilpatrick, responsable des relations développeurs chez Google, a également laissé entendre à plusieurs reprises que Google allait déployer tous ses efforts l'année prochaine, la version complète de Gemini 2.0 devant être officiellement lancée en janvier. Le PDG de Google DeepMind, Demis Hassabis, a même déclaré que ce n'était qu'un avant-goût, et que le meilleur était à venir en 2025.
Des analystes prévoient que Google pourrait rendre gratuitement accessible davantage de modèles performants l'année prochaine et lancer un modèle concurrent qui défie directement GPT-3. Pour occuper une position dominante dans cette révolution de l'IA, Google met tout en œuvre.
Gemini : le prochain produit phare de Google avec plus de 500 millions d'utilisateurs
Pour Google, le défi le plus important vient de l'empiètement d'OpenAI sur le marché de la recherche. Bien que Google domine toujours le marché de la recherche, l'IA générative offre aux utilisateurs de nouvelles façons d'accéder aux informations en ligne. OpenAI est de plus en plus considéré comme synonyme d'IA, tout comme Google l'est dans le domaine de la recherche.
Google subit une pression énorme et investit des sommes considérables dans le développement de Gemini afin de consolider son avantage dans le domaine de l'IA. L'application Gemini permet aux utilisateurs d'accéder à une variété d'outils, notamment des chatbots. Pichai a souligné que « la création de nouvelles grandes entreprises » était une priorité absolue. Google possède actuellement 15 applications comptant plus de 500 millions d'utilisateurs, et les dirigeants estiment généralement que Gemini sera la prochaine. Bien que Pichai considère que l'application Gemini a une « forte dynamique », il reconnaît qu'il reste beaucoup de travail à faire en 2025 pour combler l'écart et établir une position de leader. Il a ajouté : « La priorité majeure de l'année prochaine sera l'expansion de Gemini auprès des consommateurs. »
De plus, Google fait face à plusieurs poursuites judiciaires aux États-Unis, notamment pour monopole de la recherche et domination illégale des technologies de publicité en ligne. L'autorité de régulation britannique a également préliminairement conclu que les pratiques de Google en matière de technologie publicitaire nuisent à la concurrence dans le pays. Face à cela, Pichai a déclaré qu'il s'agissait de défis liés à l'échelle et au succès de Google, et qu'il fallait s'assurer de ne pas être distrait.
Google : peut-il prendre l'avantage en tant que « arrivant » ?
Les données d'OpenRouterAI montrent que la part de marché de Google Gemini auprès des développeurs est passée d'environ 5 % en septembre à plus de 50 %, prenant une avance considérable et entraînant une hausse de 14 % du cours de l'action. Or, cela se produit deux ans après le lancement de ChatGPT par OpenAI.
Dès 2017, Sam Altman considérait Google DeepMind comme le concurrent le plus puissant dans la course à l'AGI. Cependant, Google, autrefois considéré comme un géant de l'IA, a semblé quelque peu « désemparé » après le lancement de ChatGPT. Google a non seulement commis de nombreuses erreurs dans le lancement de ses produits, mais son cours de bourse a également chuté.
Il est étonnant de constater que Google, disposant du meilleur matériel, des données d'entraînement les plus nombreuses et des talents les plus pointus au monde, a pris du retard sur OpenAI dans la course à l'IA, et a même du mal à rivaliser avec des startups comme Anthropic. Certains analystes estiment que Google est un « gros bateau difficile à manœuvrer », et qu'en raison de considérations de sécurité, Google a besoin de plus de temps pour effectuer les contrôles de conformité. Début 2023, le lancement précipité de Bard par Google a entraîné une chute du cours de l'action en raison de réponses incorrectes. De plus, en tant que grande entreprise, Google est soumis à davantage de restrictions légales, telles que les questions de droits d'auteur sur les données des utilisateurs.
Néanmoins, Google est en train de renaître de ses cendres. Son objectif futur est de continuer à diriger le développement des « agents intelligents » et de les intégrer aux navigateurs et aux téléphones mobiles afin d'automatiser les tâches des utilisateurs.
Principaux événements IA de Google en 2024
2024 a été une année de forte activité pour l'IA chez Google. De nombreux produits renommés ont été lancés cette année, tels que les différentes versions de Gemini, NotebookLM et les fonctionnalités IA des téléphones Pixel.
Google a annoncé « 60 lancements importants d'IA » en 2024, notamment :
Modèle Gemini : Google a lancé en décembre dernier son premier modèle multi-modal natif Gemini 1.0, suivi de versions telles que Gemini 1.5 et Gemini 2.0 Flash. Ces modèles ont apporté des améliorations significatives en termes de capacités de traitement multi-modal, de fenêtre contextuelle et de performances d'inférence. Gemini 2.0 intègre des capacités multimodales et d'utilisation d'outils natifs, marquant l'entrée officielle des grands modèles dans l'ère des « agents intelligents ».
NotebookLM : Cet assistant de recherche et d'écriture basé sur l'IA, après le passage au modèle sous-jacent Gemini 1.5 Pro, permet aux utilisateurs de mieux comprendre et d'explorer des documents complexes. Sa fonction phare, Audio Overview, peut générer un audio de deux présentateurs IA discutant entre eux, aidant les utilisateurs à résumer et à approfondir les documents.
AlphaFold3 : AlphaFold3 de Google a amélioré ses performances d'au moins 50 % dans la prédiction des interactions entre les protéines et d'autres types de molécules, ouvrant de nouvelles perspectives pour les sciences biologiques.
Mobile Pixel : Google propose une série de fonctionnalités IA basées sur Gemini et Imagen 2 pour les nouveaux téléphones Galaxy S24 et Pixel 9, notamment la capacité de résumé, l'édition de photos génératives et la planification de voyages, visant à offrir aux utilisateurs une expérience plus intelligente et plus pratique grâce à l'IA.
Google met tout en œuvre et espère offrir davantage de surprises aux utilisateurs l'année prochaine.