LSLM
Ein KI-basiertes Dialogsystem für die Echtzeit-Sprachinteraktion.
Normales ProduktChattenKünstliche IntelligenzSpracherkennung
Listening-while-Speaking Language Model (LSLM) ist ein KI-Dialogmodell, das darauf ausgelegt ist, die Natürlichkeit der Mensch-Maschine-Interaktion zu verbessern. Durch die Vollduplex-Modellierung (FDM) ermöglicht es gleichzeitiges Hören und Sprechen, wodurch die Echtzeit-Interaktivität gesteigert wird. Besonders hervorzuheben ist die Möglichkeit, das System bei unzufriedenstellenden Ergebnissen zu unterbrechen und in Echtzeit zu reagieren. LSLM verwendet einen tokenbasierten Decoder, der ausschließlich TTS für die Sprachgenerierung nutzt, sowie einen Streaming-Self-Supervised-Learning (SSL)-Encoder für die Echtzeit-Audioeingabe. Drei verschiedene Fusionsstrategien (frühe, mittlere und späte Fusion) werden untersucht, um das optimale Interaktionsgleichgewicht zu finden.
LSLM Neueste Verkehrssituation
Monatliche Gesamtbesuche
158
Absprungrate
45.09%
Durchschnittliche Seiten pro Besuch
1.0
Durchschnittliche Besuchsdauer
00:00:00