Recientemente, OpenAI lanzó un importante conjunto de datos multilingüe diseñado para evaluar el rendimiento de la inteligencia artificial en 14 idiomas, incluyendo árabe, alemán, swahili, bengalí y yoruba.

Este conjunto de datos, denominado "Comprensión del Lenguaje Multilingüe a Gran Escala y Multitarea" (MMMLU), se ha publicado en la plataforma de datos abiertos Hugging Face, lo que representa un avance significativo de OpenAI en el ámbito mundial de la IA.

image.png

Acceso al conjunto de datos: https://huggingface.co/datasets/openai/MMMLU

El conjunto de datos anterior, "Comprensión del Lenguaje a Gran Escala y Multitarea" (MMLU), solo evaluaba el inglés, abarcando 57 disciplinas como matemáticas, derecho e informática. El nuevo conjunto de datos MMMLU amplía su enfoque a múltiples idiomas, con el objetivo de cubrir la falta de atención a los idiomas con pocos recursos en la investigación de IA. Esta iniciativa de OpenAI responde a la creciente demanda de empresas y gobiernos de sistemas de IA que puedan interactuar mejor con usuarios globales.

Para garantizar la alta precisión del conjunto de datos, OpenAI confió en traducciones humanas profesionales para crear el MMMLU. Esto es crucial, ya que muchas herramientas de traducción automática cometen errores sutiles al procesar idiomas con pocos recursos, lo que puede tener consecuencias graves en sectores como la medicina, el derecho y las finanzas, donde la precisión es fundamental. Por lo tanto, OpenAI, a través de la traducción humana, asegura que el conjunto de datos proporcione una base confiable para la evaluación de modelos de IA multilingües.

Simultáneamente, OpenAI anunció el lanzamiento de "OpenAI Academy", un programa diseñado para apoyar a desarrolladores y organizaciones con vocación de servicio, especialmente en países de bajos y medianos ingresos, para que utilicen la tecnología de IA para resolver problemas locales. OpenAI proporcionará capacitación, orientación técnica y 1 millón de dólares en créditos de uso de la API para ayudar a los talentos locales de IA a acceder a los recursos más recientes.

Para las empresas, el conjunto de datos MMMLU ofrece una excelente oportunidad para evaluar sus sistemas de IA en el mercado global. Ya sea para atención al cliente, moderación de contenido o análisis de datos, los sistemas de IA capaces de destacar en múltiples idiomas ayudarán a las empresas a reducir las barreras de comunicación y mejorar la experiencia del usuario.

A medida que más empresas e investigadores comiencen a utilizar este estándar multilingüe para realizar pruebas, la capacidad multilingüe de los sistemas de IA será cada vez más importante. El lanzamiento de este conjunto de datos por parte de OpenAI no solo define su posición en el campo de la IA multilingüe, sino que también impulsa positivamente el desarrollo tecnológico futuro.

Puntos clave:

🌍 OpenAI lanza el conjunto de datos MMMLU, que abarca 14 idiomas, impulsando la investigación y la aplicación de la IA multilingüe.

🧑‍🏫 El conjunto de datos fue creado por traductores humanos profesionales, lo que garantiza una alta precisión, especialmente en sectores con altas exigencias.

💡 Se lanza OpenAI Academy para brindar apoyo y promover el crecimiento y desarrollo de desarrolladores de IA en países de bajos ingresos.