Pixtral-12B-2409
Modèle multimodal de 12 milliards de paramètres, combinant un encodeur visuel pour traiter les images et le texte.
Produit OrdinaireProductivitéMultimodalTraitement d'image
Pixtral-12B-2409 est un modèle multimodal développé par l'équipe Mistral AI. Il comprend un décodeur multimodal de 12 milliards de paramètres et un encodeur visuel de 400 millions de paramètres. Ce modèle excelle dans les tâches multimodales, prend en charge les images de différentes tailles et maintient des performances de pointe dans les tests de référence textuels. Il convient aux applications avancées nécessitant le traitement de données textuelles et imagées, telles que la génération de descriptions d'images et la question-réponse visuelle.
Pixtral-12B-2409 Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44