Fish Agent V0.1 3B
Hochpräzises Sprach-zu-Sprach-Modell zur Erfassung und Generierung von Umgebungsaudioinformationen.
Normales ProduktProduktivitätSprach-zu-SprachText-zu-Sprach
Fish Agent V0.1 3B ist ein bahnbrechendes Sprach-zu-Sprach-Modell, das Umgebungsaudioinformationen mit bisher unerreichter Präzision erfassen und generieren kann. Das Modell verwendet eine Architektur ohne semantische Markierungen und eliminiert somit den Bedarf an herkömmlichen semantischen Codierern/Decodierern. Darüber hinaus handelt es sich um ein hochmodernes Text-to-Speech (TTS)-Modell, das mit 700.000 Stunden mehrsprachigen Audiodaten trainiert wurde. Als weiter trainierte Version von Qwen-2.5-3B-Instruct wurde es mit 200 Milliarden Sprach- und Textmarken trainiert. Das Modell unterstützt 8 Sprachen, darunter Englisch und Chinesisch, wobei die Datenmenge pro Sprache variiert. Englisch und Chinesisch verfügen jeweils über ca. 300.000 Stunden Trainingsdaten, die anderen Sprachen über ca. 20.000 Stunden.
Fish Agent V0.1 3B Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44