Mini-Omni

Open-Source-Großes Sprachmodell mit multimodaler Fähigkeit, das Echtzeit-Sprachaufnahme und Streaming-Audioausgabe unterstützt.

Normales ProduktProduktivitätMultimodalSpracherkennung
Mini-Omni ist ein Open-Source-Großes Sprachmodell mit multimodaler Fähigkeit, das Echtzeit-Sprachdialog mit Streaming-Audioausgabe ermöglicht. Es bietet Echtzeit-Sprach-zu-Sprach-Dialogfunktionen ohne zusätzliche ASR- oder TTS-Modelle. Darüber hinaus kann es während des Denkens Sprache ausgeben und gleichzeitig Text und Audio generieren. Mini-Omni verbessert seine Leistung durch Batch-Inferenz mit 'Audio-to-Text' und 'Audio-to-Audio'.
Website öffnen

Mini-Omni Neueste Verkehrssituation

Monatliche Gesamtbesuche

474564576

Absprungrate

36.20%

Durchschnittliche Seiten pro Besuch

6.1

Durchschnittliche Besuchsdauer

00:06:34

Mini-Omni Besuchstrend

Mini-Omni Geografische Verteilung der Besuche

Mini-Omni Traffic-Quellen

Mini-Omni Alternativen