SALMONN
SALMONN : Réseau neuronal ouvert pour la langue, l'audio, la voix et la musique
Produit OrdinaireProductivitéVoixAudio
SALMONN est un grand modèle linguistique (LLM) développé par le département d'ingénierie électronique de l'université Tsinghua et ByteDance. Il prend en charge les entrées vocales, les événements audio et musicaux. Contrairement aux modèles ne prenant en charge que les entrées vocales ou les événements audio, SALMONN peut percevoir et comprendre divers types d'entrées audio, ce qui lui confère des capacités innovantes telles que la reconnaissance et la traduction vocales multilingues, ainsi que le raisonnement conjoint audio-vocal. Cela peut être considéré comme l'attribution d'une « audition » et d'une capacité de cognition auditive à un LLM, faisant de SALMONN une étape vers une intelligence artificielle générale dotée de capacités auditives.
SALMONN Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34