Récemment, OpenAI a lancé un vaste jeu de données multilingue destiné à évaluer les performances de l'intelligence artificielle dans 14 langues, notamment l'arabe, l'allemand, le swahili, le bengali et le yoruba.

Ce jeu de données, intitulé « MMMLU » (MultiLingual Massive Multitask Language Understanding), est disponible sur la plateforme de données ouvertes Hugging Face, marquant une avancée majeure d'OpenAI dans le domaine mondial de l'IA.

image.png

Accès au jeu de données : https://huggingface.co/datasets/openai/MMMLU

Le jeu de données précédent, « MMLU » (Massive Multitask Language Understanding), ne portait que sur l'anglais et couvrait 57 disciplines, telles que les mathématiques, le droit et l'informatique. Le nouveau jeu de données MMMLU s'intéresse à plusieurs langues, comblant ainsi le manque d'attention portée aux langues faiblement représentées dans la recherche sur l'IA. Cette initiative d'OpenAI répond aux besoins croissants des entreprises et des gouvernements, permettant aux systèmes d'IA d'interagir plus efficacement avec les utilisateurs du monde entier.

Pour garantir la haute précision du jeu de données, OpenAI a fait appel à des traducteurs humains professionnels pour créer le jeu de données MMMLU. Ceci est crucial car de nombreux outils de traduction automatique peuvent commettre des erreurs subtiles lors du traitement de langues faiblement représentées, ce qui peut avoir des conséquences graves dans des secteurs exigeant une grande précision, tels que la médecine, le droit et la finance. Grâce à la traduction humaine, OpenAI assure ainsi que le jeu de données fournit une base fiable pour l'évaluation des modèles d'IA multilingues.

Parallèlement, OpenAI a annoncé le lancement de « OpenAI Academy », un programme visant à soutenir les développeurs et les organisations engagées, en particulier dans les pays à faible et moyen revenu, dans l'utilisation de l'IA pour résoudre les problèmes locaux. OpenAI fournira une formation, un accompagnement technique et 1 million de dollars de crédits d'utilisation de l'API pour aider les talents locaux en IA à accéder aux ressources les plus récentes.

Pour les entreprises, le jeu de données MMMLU offre une excellente occasion d'évaluer leurs systèmes d'IA sur le marché mondial. Que ce soit pour le service client, la modération de contenu ou l'analyse de données, des systèmes d'IA performants en plusieurs langues aideront les entreprises à réduire les obstacles à la communication et à améliorer l'expérience utilisateur.

Avec l'utilisation croissante de ce référentiel multilingue par les entreprises et les chercheurs, la capacité multilingue des systèmes d'IA deviendra de plus en plus importante. La publication de ce jeu de données par OpenAI représente non seulement son positionnement dans le domaine de l'IA multilingue, mais aussi une impulsion positive pour le développement futur des technologies.

Points clés :

🌍 OpenAI a publié le jeu de données MMMLU, couvrant 14 langues, et stimulant la recherche et l'application de l'IA multilingue.  

🧑‍🏫 Le jeu de données a été créé par des traducteurs humains professionnels, garantissant une haute précision, particulièrement utile pour les secteurs exigeants.  

💡 Lancement d'OpenAI Academy, offrant un soutien pour favoriser la croissance et le développement des développeurs d'IA dans les pays à faible revenu.