ChinaZ.com (站长之家) 18 de junio de 2024: ElevenLabs, una empresa especializada en la generación de audio, ha anunciado su incursión en la generación de video. Han lanzado un proyecto de código abierto que permite doblar automáticamente videos subidos y generar efectos de sonido apropiados.
Este proyecto se basa en su herramienta de generación de efectos de sonido a partir de texto, pudiéndose considerar una versión simplificada de Google V2A. La herramienta ya está disponible para los usuarios.
A principios de junio, ElevenLabs presentó una nueva función que permite a los usuarios generar diversos efectos de sonido realistas a partir de texto. Esta función es una gran ayuda para las industrias del cine, los videojuegos y los videos cortos, ya que elimina la necesidad de buscar efectos de sonido manualmente, y la mayoría de los efectos cuentan con licencia comercial de Shutterstock.
Además de la generación de efectos de sonido, ElevenLabs ofrece otras funciones potentes, como la clonación de voz y la conversión de texto a voz. Los usuarios pueden subir un fragmento de audio para extraer sus características y generar nuevo contenido de texto; también pueden convertir grandes cantidades de texto en voz con entonación, dando a su contenido una expresión más vívida. Aunque el soporte para chino es limitado, la generación de contenido en inglés es excelente.
Acceso a la conversión de texto a audio: https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi
Acceso al doblaje automático de video: https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api