EmoPP es un modelo de generación de frases rítmicas basado en la percepción de emociones. Mejora la capacidad de expresión emocional de la síntesis de voz mediante la extracción precisa de las claves emocionales del texto. El código de EmoPP se ha publicado en GitHub como código abierto; los usuarios pueden personalizar el entrenamiento y la aplicación para mejorar la naturalidad de diversos sistemas de interacción de voz. Este modelo admite varios conjuntos de datos y supera a los modelos base en términos de expresión emocional, con el potencial de ofrecer una salida de voz más vívida en aplicaciones como asistentes de voz.
Modelo de texto a voz EmoPP de código abierto basado en la prosodia emocional

站长之家
Este artículo proviene de AIbase Daily
¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.