EMOVA
Modèle linguistique multimodale riche en émotions
Produit OrdinaireAutreMultimodalReconnaissance vocale
EMOVA (EMotionally Omni-present Voice Assistant) est un modèle linguistique multimodale capable de traiter la voix de bout en bout tout en maintenant des performances de pointe en vision-langage. Grâce à un découpage de la parole basé sur la décomposition sémantique-acoustique, il permet des dialogues multimodaux riches en émotions et atteint des performances de pointe dans les tests de référence vision-langage et vocaux.