Aya Vision 32B
Aya Vision 32B est un modèle de langage visuel multilingue adapté à de multiples usages, tels que l'OCR, la description d'images et le raisonnement visuel.
Produit OrdinaireImageMultilingueLangage visuel
Aya Vision 32B est un modèle de langage visuel avancé développé par Cohere For AI, doté de 32 milliards de paramètres et prenant en charge 23 langues, notamment l'anglais, le chinois et l'arabe. Ce modèle combine le dernier modèle linguistique multilingue Aya Expanse 32B et l'encodeur visuel SigLIP2, grâce à un adaptateur multimodal permettant de combiner la compréhension visuelle et linguistique. Il offre des performances exceptionnelles dans le domaine du langage visuel et peut traiter des tâches complexes d'images et de texte, telles que l'OCR, la description d'images et le raisonnement visuel. La publication de ce modèle vise à promouvoir la diffusion de la recherche multimodale, ses poids open source offrant aux chercheurs du monde entier un outil puissant. Ce modèle est soumis à la licence CC-BY-NC et doit respecter la politique d'utilisation raisonnable de Cohere For AI.
Aya Vision 32B Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44