Fish Agent V0.1 3B
Modèle de synthèse vocale capable de capturer et de générer des informations audio environnementales avec une grande précision.
Produit OrdinaireProductivitéSynthèse vocaleTexte à parole
Fish Agent V0.1 3B est un modèle de synthèse vocale révolutionnaire capable de capturer et de générer des informations audio environnementales avec une précision inégalée. Ce modèle utilise une architecture sans marquage sémantique, éliminant ainsi le besoin d'encodeurs/décodeurs sémantiques traditionnels. C'est également un modèle de pointe de texte à parole (TTS) entraîné sur 700 000 heures de contenu audio multilingue. Version de pré-entraînement continu de Qwen-2.5-3B-Instruct, il a été entraîné sur 200 milliards de jetons audio et textuels. Il prend en charge 8 langues, dont l'anglais et le chinois, avec des quantités de données d'entraînement variables pour chaque langue : environ 300 000 heures pour l'anglais et le chinois, et environ 20 000 heures pour les autres langues.
Fish Agent V0.1 3B Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44