Llama-3.2-11B-Vision

Modèle linguistique de grande taille multimodale, prenant en charge le traitement d'images et de texte.

Produit OrdinaireProductivitéMultimodalTraitement d'images
Llama-3.2-11B-Vision est un grand modèle linguistique multimodale (LLM) publié par Meta. Il combine les capacités de traitement d'images et de texte, visant à améliorer les performances de la reconnaissance visuelle, du raisonnement d'images, de la description d'images et de la réponse aux questions générales sur les images. Ce modèle surpasse de nombreux modèles multimodaux open source et propriétaires sur des benchmarks sectoriels courants.
Ouvrir le site Web

Llama-3.2-11B-Vision Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

Llama-3.2-11B-Vision Tendance des visites

Llama-3.2-11B-Vision Distribution géographique des visites

Llama-3.2-11B-Vision Sources de trafic

Llama-3.2-11B-Vision Alternatives