ChinaZ.com le 18 juin : ElevenLabs, une entreprise spécialisée dans la génération audio, annonce son entrée dans le domaine de la génération vidéo. Elle a publié un projet open source capable de doubler automatiquement les vidéos téléchargées et de générer des effets sonores appropriés.
Ce projet est basé sur son outil de génération de sons à partir de texte, une version simplifiée de Google V2A. L'outil est désormais disponible pour les utilisateurs.
Début juin, ElevenLabs a lancé une nouvelle fonctionnalité permettant de générer divers effets sonores réalistes à partir de texte. Cette fonctionnalité est un atout majeur pour le cinéma, les jeux vidéo, les courtes vidéos, etc. Elle permet aux utilisateurs d'éviter la recherche fastidieuse d'effets sonores, la plupart étant d'ailleurs sous licence commerciale Shutterstock.
Outre la génération d'effets sonores, ElevenLabs propose d'autres fonctionnalités puissantes, telles que le clonage vocal et la conversion texte-parole. Les utilisateurs peuvent télécharger un extrait vocal pour en extraire les caractéristiques et générer de nouveaux contenus textuels ; ils peuvent également convertir de longs textes en voix expressives, donnant ainsi plus de vie à leurs contenus. Bien que la prise en charge du chinois soit limitée, les résultats sont excellents pour le contenu anglais.
Accès à la conversion texte-audio : https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi
Accès au doublage automatique vidéo : https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api