ChinaZ.com (站长之家) Meldung vom 18. Juni: ElevenLabs, ein Unternehmen, das sich auf die Generierung von Audioinhalten spezialisiert hat, kündigte kürzlich seinen Einstieg in die Videoproduktion an. Sie haben ein Open-Source-Projekt veröffentlicht, das Videos automatisch mit passenden Sprachausgaben und Soundeffekten versehen kann.
Dieses Projekt basiert auf ihrem Tool zur Texterstellung von Soundeffekten und kann als abgespeckte Version von Googles V2A betrachtet werden. Das Tool steht Nutzern bereits zur Verfügung.
Anfang Juni stellte ElevenLabs eine neue Funktion vor, mit der Benutzer durch Texteingabe realistische Musik- und Soundeffekte generieren können. Diese Funktion ist eine enorme Hilfe für die Film-, Spiele- und Kurzvideoindustrie. Sie erspart Nutzern die mühsame Suche nach passenden Soundeffekten, wobei die meisten Effekte über eine kommerzielle Lizenz von Shutterstock verfügen.
Neben der Soundeffektgenerierung bietet ElevenLabs weitere leistungsstarke Funktionen wie Sprachklonung und Text-to-Speech. Benutzer können eine Sprachprobe hochladen, um Merkmale zu extrahieren und neue Textinhalte zu generieren; oder sie können lange Texte in gefühlvolle Sprache umwandeln und ihren Inhalten so eine lebendigere Ausdrucksform verleihen. Obwohl die chinesische Sprachunterstützung eingeschränkt ist, liefert das Tool hervorragende Ergebnisse bei der englischen Sprachausgabe.
Text-to-Audio-Eingabe:https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi
Automatische Video-Synchronisation:https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api