Meta hat kürzlich die neue Sprachübersetzungsmodellreihe Seamless Communication veröffentlicht, die aus vier Modellen besteht und Echtzeit-Sprachübersetzung zwischen fast 100 Sprachen mit einer Latenz von etwa 2 Sekunden ermöglicht. Die Modelle können komplexe Merkmale der ursprünglichen Sprache wie Pausen, Tonfall und Sprechgeschwindigkeit replizieren, um eine natürlichere Übersetzung zu gewährleisten. Sie verwenden eine nicht-autoregressive Architektur, um die Übersetzung langer Sequenzen zu unterstützen. Darüber hinaus hat Meta die Modelle und den größten Sprachdatenkorpus mit 585.000 Stunden an Daten Open Source zur Verfügung gestellt und Funktionen wie Audio-Wasserzeichen und die Minderung von toxischen Übersetzungen hinzugefügt, um einen Missbrauch der Modelle zu verhindern.
Meta veröffentlicht neues Sprachübersetzungsmodell mit Stimmimitation

量子位
87
© Alle Rechte vorbehalten AIbase-Basis 2024, klicken Sie hier, um die Quelle anzuzeigen - https://www.aibase.com/de/news/4426