LSLM

Ein KI-basiertes Dialogsystem für die Echtzeit-Sprachinteraktion.

Normales ProduktChattenKünstliche IntelligenzSpracherkennung
Listening-while-Speaking Language Model (LSLM) ist ein KI-Dialogmodell, das darauf ausgelegt ist, die Natürlichkeit der Mensch-Maschine-Interaktion zu verbessern. Durch die Vollduplex-Modellierung (FDM) ermöglicht es gleichzeitiges Hören und Sprechen, wodurch die Echtzeit-Interaktivität gesteigert wird. Besonders hervorzuheben ist die Möglichkeit, das System bei unzufriedenstellenden Ergebnissen zu unterbrechen und in Echtzeit zu reagieren. LSLM verwendet einen tokenbasierten Decoder, der ausschließlich TTS für die Sprachgenerierung nutzt, sowie einen Streaming-Self-Supervised-Learning (SSL)-Encoder für die Echtzeit-Audioeingabe. Drei verschiedene Fusionsstrategien (frühe, mittlere und späte Fusion) werden untersucht, um das optimale Interaktionsgleichgewicht zu finden.
Website öffnen

LSLM Neueste Verkehrssituation

Monatliche Gesamtbesuche

158

Absprungrate

45.09%

Durchschnittliche Seiten pro Besuch

1.0

Durchschnittliche Besuchsdauer

00:00:00

LSLM Besuchstrend

LSLM Geografische Verteilung der Besuche

LSLM Traffic-Quellen

LSLM Alternativen