Récemment, Yann LeCun, le scientifique en chef de l'IA chez Meta, a déclaré que l'intelligence artificielle autonome (AMI) pourrait véritablement améliorer la vie quotidienne des gens. Meta s'efforce d'améliorer les capacités de raisonnement de son modèle Llama, dans le but de rivaliser avec des modèles de pointe tels que GPT-4o.

Llama2, Meta, intelligence artificielle, grand modèle linguistique, IA

Manohar Paluri, vice-président de Meta, a mentionné que l'entreprise explore la possibilité de permettre au modèle Llama non seulement de « planifier », mais également d'évaluer les décisions en temps réel et de s'adapter aux changements de conditions. Cette approche itérative, combinée à la technique de la « chaîne de pensée », vise à créer une intelligence artificielle autonome capable de combiner efficacement la perception, le raisonnement et la planification.

De plus, Paluri a souligné que, dans le raisonnement de l'IA dans des « domaines non vérifiables », les modèles doivent décomposer les tâches complexes en étapes gérables afin de s'adapter dynamiquement. Par exemple, planifier un voyage ne consiste pas seulement à réserver des billets d'avion, mais aussi à gérer les changements de météo en temps réel, ce qui peut entraîner une replanification de l'itinéraire. Meta a récemment lancé le modèle Dualformer, capable de basculer dynamiquement entre l'intuition rapide et la réflexion lente au cours du processus cognitif humain, permettant ainsi de résoudre efficacement des tâches complexes.

Concernant l'entraînement du modèle Llama, Meta utilise l'apprentissage autosupervisé (SSL), qui aide le modèle à apprendre des représentations de données étendues dans plusieurs domaines, lui conférant ainsi de la flexibilité. Parallèlement, l'apprentissage par renforcement avec rétroaction humaine (RLHF) permet au modèle d'affiner ses performances sur des tâches spécifiques. La combinaison des deux permet au modèle Llama d'exceller dans la génération de données synthétiques de haute qualité, en particulier dans les régions où les caractéristiques linguistiques sont rares.

Concernant le lancement de Llama4, Mark Zuckerberg, PDG de Meta, a révélé lors d'une interview que l'équipe avait déjà commencé le pré-entraînement de Llama4. Il a également mentionné que Meta est en train de construire des clusters de calcul et une infrastructure de données pour Llama4, ce qui devrait constituer un progrès majeur. Paluri a plaisanté en disant que si on demandait à Zuckerberg la date de lancement, il répondrait probablement « aujourd'hui », soulignant ainsi la rapidité des progrès de l'entreprise dans le développement de l'IA.

Meta prévoit de continuer à lancer de nouvelles versions de Llama dans les prochains mois afin d'améliorer continuellement les capacités de l'IA. Grâce à des mises à jour fréquentes, les développeurs peuvent s'attendre à des améliorations significatives à chaque nouvelle version.

Points clés :

- 🤖 Le scientifique en chef de l'IA de Meta estime que l'intelligence artificielle autonome contribuera à améliorer la vie quotidienne.

- 🚀 Le modèle Llama combinera l'apprentissage autosupervisé et l'apprentissage par renforcement pour améliorer ses capacités de raisonnement multidomaines.

- 📅 Le pré-entraînement de Llama4 a commencé, et son lancement est prévu aux alentours de 2025.