Mini-Omni
Open-Source-Großes Sprachmodell mit multimodaler Fähigkeit, das Echtzeit-Sprachaufnahme und Streaming-Audioausgabe unterstützt.
Normales ProduktProduktivitätMultimodalSpracherkennung
Mini-Omni ist ein Open-Source-Großes Sprachmodell mit multimodaler Fähigkeit, das Echtzeit-Sprachdialog mit Streaming-Audioausgabe ermöglicht. Es bietet Echtzeit-Sprach-zu-Sprach-Dialogfunktionen ohne zusätzliche ASR- oder TTS-Modelle. Darüber hinaus kann es während des Denkens Sprache ausgeben und gleichzeitig Text und Audio generieren. Mini-Omni verbessert seine Leistung durch Batch-Inferenz mit 'Audio-to-Text' und 'Audio-to-Audio'.
Mini-Omni Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34