EMOVA

Modelo de linguagem multimodal rico em emoções

Produto ComumOutrosMultimodalReconhecimento de Fala
EMOVA (EMotionally Omni-present Voice Assistant) é um modelo de linguagem multimodal capaz de processamento de fala de ponta a ponta, mantendo simultaneamente desempenho de ponta em visão-linguagem. O modelo, por meio de um segmentador de fala com desacoplamento semântico-acústico, alcança diálogos multimodais ricos em emoções e atinge desempenho de ponta em benchmarks de visão-linguagem e fala.
Abrir Site

EMOVA Alternativas