Meta anunció recientemente una nueva asociación de tecnología lingüística con la UNESCO para recopilar grabaciones de voz y transcripciones en una variedad de idiomas, impulsando así el desarrollo futuro de la inteligencia artificial (IA) de acceso abierto. Este programa se centra especialmente en los idiomas de las minorías que se encuentran desatendidos en el entorno digital.
Según Meta, el programa busca atraer a socios que proporcionen más de 10 horas de grabaciones de voz con sus transcripciones, extensos textos escritos y conjuntos de oraciones traducidas. Meta espera integrar estos idiomas en sus modelos de reconocimiento y traducción de voz de IA a través del esfuerzo conjunto con sus socios, y los resultados finales se publicarán como código abierto.
Nota de la fuente: Imagen generada por IA, proveedor de servicios de licencias de imágenes Midjourney
Hasta la fecha, entre los socios confirmados se encuentra el gobierno de Nunavut, en el norte de Canadá, donde parte de la población habla inuktitut. Meta declaró en su blog: "Nuestros esfuerzos se centran especialmente en los idiomas desatendidos para apoyar el trabajo de la UNESCO. En última instancia, nuestro objetivo es crear sistemas inteligentes capaces de comprender y responder a las complejas necesidades humanas, independientemente del idioma o el contexto cultural".
Para complementar este programa, Meta también lanzará un punto de referencia de traducción automática de código abierto diseñado para evaluar el rendimiento de los modelos de traducción de idiomas. Este punto de referencia, diseñado por lingüistas, admite siete idiomas y está disponible para su acceso y contribución a través de la plataforma de desarrollo de IA Hugging Face.
Meta considera estas dos iniciativas como acciones filantrópicas, pero la empresa también se beneficiará de la mejora de sus modelos de reconocimiento y traducción de voz. Meta continúa expandiendo la cantidad de idiomas compatibles con su asistente de IA, Meta AI, y está probando funciones como la traducción de voz en Instagram Reels, permitiendo a los creadores doblar sus videos y sincronizarlos automáticamente.
A pesar de los esfuerzos de Meta en el procesamiento del lenguaje, la empresa ha recibido críticas por su manejo de contenido que no está en inglés. Se ha informado que Facebook no marcó casi el 70% de la desinformación sobre COVID-19 en italiano y español, mientras que el porcentaje de contenido no marcado en inglés fue del 29%. Además, documentos filtrados revelan que el contenido en árabe se etiquetó erróneamente como discurso de odio con frecuencia. Meta afirma que está tomando medidas para mejorar sus técnicas de traducción y moderación de contenido para abordar estos desafíos.