Anthropic vient de lancer Claude 3, sa nouvelle génération de grands modèles linguistiques, qui a suscité l'enthousiasme de la communauté de l'IA grâce à ses capacités d'auto-conscience. Cette avancée a déclenché une réflexion au sein du secteur de l'IA sur l'évaluation des capacités et des limites réelles des modèles. Des analyses montrent que Claude 3 Opus surpasse GPT-4 et Gemini 1.0 Ultra dans plusieurs tests de référence, démontrant ainsi ses performances exceptionnelles. Des évaluations approfondies ont été menées sur le traitement de longs textes, la traduction entre le chinois et l'anglais, le raisonnement logique, la compréhension mathématique et la programmation, révélant ainsi ses capacités globales.