Play AI hat kürzlich sein ehrgeizigstes Produkt vorgestellt: PlayDialog Beta, ein KI-Modell zur Generierung von dialogbasierten Podcast-Audios.

image.png

Dieses End-to-End-KI-Sprachmodell nutzt den Kontext vergangener Dialoge, um Tonfall, Emotionen und Sprechgeschwindigkeit zu steuern und so eine natürlichere Sprachsynthese zu ermöglichen. PlayDialog markiert einen neuen Höhepunkt in der Mensch-Maschine-Kommunikation. Es eignet sich besonders für die Erstellung authentischer Dialogerlebnisse, wie z.B. Erzählungen, Sprachausgabe, Podcast-Produktion und bietet im Geschäftsumfeld immersive, persönliche Sprachinteraktionen, ähnlich wie Google NotebookLM.

Gleichzeitig hat Play AI PlayNote vorgestellt, ein Tool, das verschiedene Mediendateien (wie PDFs, Texte, Videos usw.) in Dialogerlebnisse umwandelt. Benutzer können innerhalb weniger Minuten Podcasts, Präsentationen, Erzählungen oder sogar Kindergeschichten erstellen und dabei die flüssige, natürliche Sprachqualität von PlayDialog genießen. Das Besondere an PlayNote ist seine API-Schnittstelle, die eine programmatische Audiogenerierung ohne Benutzeroberfläche ermöglicht.

image.png

PlayDialog Beta wurde mit Millionen von realen Dialogen trainiert und ist etwa zehnmal größer als Play AI 3.0 mini. Es kann Tonfall (z.B. die Betonung, die Sprechgeschwindigkeit) an die menschliche Stimme anpassen. In Blindtests übertraf PlayDialog Beta führende Konkurrenzmodelle um das Doppelte, insbesondere bei der Ausdruckskraft.

Im Gegensatz zu bisherigen Sprachmodellen versteht PlayDialog Beta den Kontext des gesamten Dialogs, was die Sprachgenerierung beeinflusst. Play AI hat eine neue Architektur namens „Adaptive Sprachkontextualisierer“ (ASC) entwickelt, die es dem Modell ermöglicht, die gesamte Dialoghistorie für die Antwort zu nutzen. So ist jeder Satz kein isolierter Output, sondern reichhaltig und mit dem passenden Tonfall, den Emotionen und der richtigen Aussprache versehen, so dass der synthetisierte Podcast dem Hörer das Gefühl vermittelt, dass der Sprecher im selben Raum kommuniziert.

Ob es sich um lebhafte Diskussionen oder sensible Themen handelt, die Empathie erfordern – PlayDialog passt sich nahtlos an und macht die Interaktion natürlicher und menschlicher.

Benutzer können all dies mit PlayNote erleben und damit kraftvolle, natürliche Erzählungen, Podcasts und Präsentationen in wenigen Minuten erstellen. PlayNote kann auch über eine API-Schnittstelle genutzt werden, die es Entwicklern ermöglicht, auf programmatische Weise Inhalte im großen Stil zu generieren.

Zugang zu PlayNote: https://play.ai/playnote

Offizieller Blogbeitrag: https://blog.play.ai/blog/introducing-playdialog

Wichtigste Punkte:

🌟 PlayDialog Beta ist das neue Sprachmodell von Play AI, das menschliche Dialoge natürlicher simuliert.

🎤 PlayNote ermöglicht die schnelle Umwandlung verschiedener Mediendateien in Audioinhalte und bietet eine API-Schnittstelle.

🚀 PlayDialog Beta erzielte in Blindtests hervorragende Ergebnisse, sowohl bei der Flüssigkeit der Sprachgenerierung als auch bei der emotionalen Ausdruckskraft.