Test Reddit : GPT-4o bat Gemini 1.5 pro aux échecs

AIbase基地

Publié leActualités IA · 4 minutes de lecture · Aug 8, 2024

119

Récemment, l'utilisateur Reddit @zefman a mené une expérience intéressante : il a créé une plateforme permettant à différents modèles linguistiques (LLM) de jouer aux échecs en temps réel. L'objectif ? Évaluer les performances de ces modèles de manière amusante et accessible.

Il est bien connu que ces modèles ne sont pas des joueurs d'échecs exceptionnels, mais malgré cela, @zefman a trouvé l'expérience riche en enseignements.

Dans cette expérience, @zefman s'est concentré sur quelques-uns des modèles les plus récents, GPT-4o se distinguant nettement comme le joueur le plus fort. Il a comparé GPT-4o à d'autres modèles comme Claude et Gemini, observant les différences de performance et trouvant le processus de réflexion et de raisonnement de chaque modèle fascinant. La plateforme permet de visualiser l'analyse de la partie par chaque modèle à chaque étape.

@zefman a conçu un affichage simple des parties. Chaque modèle reçoit les mêmes instructions pour un même état de jeu, incluant l'état du plateau, la notation FEN (Forsyth–Edwards Notation) et les deux derniers coups joués. Cette méthode garantit que chaque modèle prend ses décisions sur la base des mêmes informations, assurant ainsi une comparaison équitable.

Chaque modèle utilise les mêmes instructions, qui sont mises à jour avec l'état du plateau en ASCII, la notation FEN, et les deux coups précédents ainsi que la réflexion. Voici un exemple :

De plus, @zefman a remarqué que certains modèles, notamment les moins performants, pouvaient faire plusieurs mauvais coups. Pour pallier cela, il leur a accordé cinq chances de refaire leur choix. Si aucun coup valide n'était proposé, un coup valide était choisi aléatoirement pour maintenir le déroulement de la partie.

Sa conclusion : GPT-4o reste le plus fort, battant Gemini 1.5 pro aux échecs.

Points clés :
🌟 GPT-4o a démontré d'excellentes performances, devenant le modèle linguistique le plus fort de l'expérience.
♟️ L'expérience permet des parties en temps réel entre différents modèles, analysant leur processus de réflexion.
🔄 Les modèles moins performants ont parfois fait des erreurs, offrant une expérience interactive intéressante.

OpenAI lance GPT-4O-Audio-Preview : la voix peut désormais "comprendre" les émotions !

OpenAI révolutionne une fois de plus le secteur de l'intelligence artificielle avec le lancement de son nouveau modèle gpt-4o-audio-preview. Ce modèle fait preuve de capacités étonnantes en matière de génération et d'analyse vocale, ouvrant de nouvelles perspectives pour l'interaction homme-machine. Découvrons ensemble les caractéristiques et les applications potentielles de ce modèle innovant. Les fonctionnalités principales de gpt-4o-audio-preview se répartissent en trois axes : premièrement, il est capable de générer des réponses vocales naturelles et fluides à partir de texte, ce qui est idéal pour les assistants vocaux et les services clients virtuels.

La Coupe de l'America utilise l'IA pour rendre le vent « visible »

Lors de la 37e Coupe de l'America, le programme WindSightIQ a été introduit pour la première fois à la télévision. Grâce à la technologie Lidar, à la fusion de capteurs et au calcul scientifique, il visualise le champ de vent sous forme de graphiques de réalité augmentée et de réalité virtuelle, aidant les spectateurs à comprendre les facteurs clés du vent dans la navigation à voile. Bien que les navigateurs dépendent toujours de leur intuition et de leur entraînement pour planifier leur itinéraire, les commentateurs et les spectateurs peuvent désormais voir en temps réel les schémas de vent, comparer les performances réelles au meilleur itinéraire, et ainsi participer à la course à un niveau sans précédent. Cette innovation offre une expérience de visionnage totalement nouvelle, rendant visible le vent, un élément généralement invisible.

Nouveau modèle OpenAI gpt-4o-2024-08-06 et gpt-4o-mini prennent en charge la sortie structurée

OpenAI a ajouté une fonctionnalité de sortie structurée à son API, garantissant que la sortie générée est parfaitement conforme à la structure JSON prédéfinie, améliorant ainsi considérablement la fiabilité de l'API et la précision des applications. Cette fonctionnalité définit non seulement la structure du JSON, mais garantit également l'exactitude de la sortie. Simultanément, les prix ont été réduits : le coût d'entrée a été diminué de moitié et le coût de sortie de 1/3. L'introduction de la sortie structurée a résolu les limitations du schéma JSON en matière de garantie de conformité de la sortie à une structure spécifique, améliorant considérablement les performances du modèle en matière de sortie structurée. Grâce à des innovations techniques, telles que la limitation...

OpenAI lance le nouveau modèle gpt-4o-64k-output-alpha : l'API GPT-4o prend désormais en charge des sorties jusqu'à 64K

Le point fort du nouveau modèle gpt-4o-64k-output-alpha d'OpenAI est sa capacité à générer des sorties jusqu'à 64K tokens en une seule fois. Idéal pour créer du contenu riche et détaillé, il répond aux besoins de la rédaction, de la programmation et de l'analyse de données complexes. Cependant, cette fonctionnalité augmente le prix de l'API : 18 $ par million de tokens en sortie, contre 6 $ par million de tokens en entrée. Cette mesure vise à compenser les coûts de calcul élevés et à encourager une utilisation responsable de cet outil puissant. Ce modèle est une avancée majeure pour les domaines de la création et de la recherche.