La inteligencia artificial ha logrado avances significativos en la comprensión de las emociones humanas. A principios de este mes, concluyó con éxito la segunda edición del concurso de reconocimiento de emociones multimodales (MER24), un evento de alto nivel organizado conjuntamente por varios académicos de renombre internacional, cuyo objetivo es impulsar la aplicación de la tecnología de reconocimiento de emociones de IA en escenarios reales de interacción humano-máquina.

El concurso MER24 constó de tres categorías, entre las que la categoría Semi destacó por su alta dificultad y la intensa competencia. La categoría Semi requería que los equipos participantes entrenaran modelos utilizando una pequeña cantidad de datos etiquetados y una gran cantidad de datos no etiquetados, y evaluaran el rendimiento y la capacidad de generalización del modelo en conjuntos de datos no etiquetados. El equipo de tecnología de voz de Soul App obtuvo el primer lugar en esta categoría gracias a su innovadora solución técnica.

image.png

Sitio web del concurso: https://zeroqiaoba.github.io/MER2024-website/#organization

El éxito del equipo de Soul se debe a su sólida experiencia e innovación en la comprensión de datos multimodales, algoritmos de reconocimiento de emociones, herramientas de plataformas de optimización de modelos y desarrollo de flujos de trabajo internos, así como a la eficiente colaboración del equipo técnico. Ante el desafío de la escasez de datos, el equipo de Soul adoptó diversas estrategias, incluyendo la mejora de las técnicas de aprendizaje semi-supervisado, la utilización de modelos pre-entrenados para extraer características multimodales, la propuesta de métodos efectivos de fusión de características y modelos innovadores para las modalidades de vídeo y texto.

La solución técnica del equipo de Soul no solo mejoró la precisión del reconocimiento de emociones, sino que también permitió una mejor diferenciación entre los límites emocionales fácilmente confundibles. Este logro es una muestra del profundo trabajo de Soul en la tecnología de modelos de IA a gran escala en el ámbito social, especialmente en la capacidad de interacción emocional multimodal.

La demanda de IA emocional en el ámbito social está creciendo cada vez más. Soul, mediante la creación de una IA con capacidad emocional, ha logrado la transición de "ejecutor de tareas" a "compañero que satisface las necesidades emocionales humanas". Las aplicaciones de IA desarrolladas por Soul, como Gou Dan, el juego Hombre Lobo y Ecos del Otro Mundo, muestran la capacidad de fusión de Soul en aspectos como la personificación, el conocimiento, la multimodalidad y la percepción temporal, ofreciendo a los usuarios una experiencia de interacción con IA rica y cálida.

2024 se considera el año inaugural de las aplicaciones AIGC. Empresas nacionales como Soul, a través de la acumulación de tecnología propia, han logrado resultados notables en el ámbito de las redes sociales con IA. Soul ha incubado una serie de productos basados en sus propios modelos lingüísticos y de voz a gran escala, y ha acumulado una rica experiencia en innovación tecnológica y práctica en el proceso de mejora de la interacción emocional entre la IA y los usuarios.

En el futuro, plataformas como Soul, que se mantienen comprometidas con la innovación tecnológica y de producto, seguirán creando valor para los usuarios, logrando un valor comercial más duradero y diverso sobre la base de la creación de un ecosistema de contenido y comunidad próspero.