Fish Agent V0.1 3B

Modèle de synthèse vocale capable de capturer et de générer des informations audio environnementales avec une grande précision.

Produit OrdinaireProductivitéSynthèse vocaleTexte à parole
Fish Agent V0.1 3B est un modèle de synthèse vocale révolutionnaire capable de capturer et de générer des informations audio environnementales avec une précision inégalée. Ce modèle utilise une architecture sans marquage sémantique, éliminant ainsi le besoin d'encodeurs/décodeurs sémantiques traditionnels. C'est également un modèle de pointe de texte à parole (TTS) entraîné sur 700 000 heures de contenu audio multilingue. Version de pré-entraînement continu de Qwen-2.5-3B-Instruct, il a été entraîné sur 200 milliards de jetons audio et textuels. Il prend en charge 8 langues, dont l'anglais et le chinois, avec des quantités de données d'entraînement variables pour chaque langue : environ 300 000 heures pour l'anglais et le chinois, et environ 20 000 heures pour les autres langues.
Ouvrir le site Web

Fish Agent V0.1 3B Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

Fish Agent V0.1 3B Tendance des visites

Fish Agent V0.1 3B Distribution géographique des visites

Fish Agent V0.1 3B Sources de trafic

Fish Agent V0.1 3B Alternatives