Percée de l'IA chinoise ! Le nouveau modèle Yi-Lightning de Zero One dépasse GPT-4o

Récemment, un classement des modèles d'IA, établi grâce à un vote à l'aveugle mené auprès de millions d'utilisateurs dans le monde, a été publié. Le modèle d'IA chinois « Yi-Lightning » a créé la surprise en surpassant GPT-4, qui occupait la première place depuis longtemps.

Le modèle « Yi-Lightning » a été développé par la société chinoise d'IA, Lingyi Wanwu. Il s'est classé parmi les meilleurs dans plusieurs catégories, atteignant même la troisième place ex-aequo avec des géants internationaux dans la catégorie mathématiques.

Il est important de noter que le score de « Yi-Lightning » est presque identique à celui de Grok-2-08-13, le dernier modèle xAI de Musk, et qu'il surpasse largement GPT-4o-2024-05-13, GPT-4o-mini-2024-07-18 et Claude3.5Sonnet, entre autres concurrents.

Les règles de ce classement ont subi des modifications importantes, privilégiant désormais la capacité des modèles d'IA à résoudre des problèmes concrets, plutôt que la longueur et le style des réponses.

Sous ces nouvelles règles, « Yi-Lightning » se maintient au même niveau que GPT-4 et Grok-2, démontrant ainsi sa puissance.

La traduction est un domaine d'application important des modèles d'intelligence artificielle. Elle teste pleinement les capacités du modèle en matière de compréhension du langage, de génération, d'échanges interlinguistiques et de gestion du contexte. Comparé à des modèles tels que Qwen2.5-72b-Instruct, DeepSeek-V2.5 et Doubao-pro, Yi-Lightning a démontré des performances exceptionnelles en traduction : il est non seulement plus rapide, mais ses traductions sont également plus riches et plus fidèles à l'esprit de la langue chinoise.

Par exemple, j'ai pris au hasard un extrait en anglais concernant Notre-Dame de Paris. Yi-Lightning a non seulement traduit plus rapidement, mais le résultat est également plus adapté au contexte chinois :

Les innovations technologiques derrière le modèle Yi-Lightning sont également remarquables. Il utilise une architecture de modèle d'expert mixte, un mécanisme d'attention mixte optimisé, réduisant considérablement le coût d'inférence lors du traitement de longues séquences de données. De plus, Yi-Lightning a introduit un mécanisme d'attention inter-couches, permettant un partage d'informations plus efficace entre les différentes couches.

Plus intéressant encore, Yi-Lightning peut choisir dynamiquement la combinaison de réseaux d'experts la plus appropriée en fonction de la difficulté de la tâche. Pendant la phase d'entraînement, tous les réseaux d'experts sont activés, mais pendant la phase d'inférence, Yi-Lightning active sélectivement les experts pertinents en fonction de la tâche spécifique, garantissant ainsi une gestion efficace de tous les défis.

Le modèle « Yi-Lightning » utilise une architecture de modèle d'expert mixte et un mécanisme d'attention mixte optimisé, permettant un traitement efficace des longues séquences de données et un partage d'informations efficace entre les différentes couches grâce à un mécanisme d'attention inter-couches.

Plus impressionnant encore, « Yi-Lightning » peut choisir dynamiquement la combinaison de réseaux d'experts la plus appropriée, garantissant ainsi une gestion efficace de tous les défis.

Le Dr Kai-Fu Lee, fondateur et PDG de Lingyi Wanwu, a déclaré que le modèle « Yi-Lightning » a utilisé plusieurs stratégies lors de la phase de pré-entraînement pour garantir non seulement sa vitesse, mais aussi l'apprentissage de connaissances plus riches.

Parallèlement, la stratégie de tarification de « Yi-Lightning » est très compétitive, avec un prix de seulement 0,99 yuan pour un million de jetons, offrant un excellent rapport qualité-prix. Le Dr Kai-Fu Lee a également souligné que les performances exceptionnelles de « Yi-Lightning » ont réduit l'écart entre l'IA chinoise et les meilleurs grands modèles internationaux à cinq mois, ce qui représente non seulement un progrès technologique, mais aussi un témoignage de confiance dans l'industrie chinoise de l'IA.

Référence : https://x.com/lmarena_ai/status/1846245604890116457

Actualités IA

Percée de l'IA chinoise ! Le nouveau modèle Yi-Lightning de Zero One dépasse GPT-4o

AIbase基地

Recommandations d'actualités IA connexes

OpenAI lance GPT-4O-Audio-Preview : la voix peut désormais "comprendre" les émotions !

Nouveau modèle OpenAI gpt-4o-2024-08-06 et gpt-4o-mini prennent en charge la sortie structurée

OpenAI lance le nouveau modèle gpt-4o-64k-output-alpha : l'API GPT-4o prend désormais en charge des sorties jusqu'à 64K