llama3v

Modèle de vision SOTA (State Of The Art) basé sur Llama3 8B

Produit OrdinaireImageModèle de visionApprentissage multimodal
Llama3v est un modèle de vision SOTA (State Of The Art) basé sur Llama3 8B et siglip-so400m. Il s'agit d'un modèle VLLM (Visual Language Large Model) open source dont les poids sont disponibles sur Hugging Face. Il permet une inférence locale rapide et son code d'inférence est public. Ce modèle combine la reconnaissance d'images et la génération de texte. Il améliore la compréhension des images grâce à l'ajout d'une couche de projection qui mappe les caractéristiques de l'image dans l'espace d'intégration de LLaMA.
Ouvrir le site Web

llama3v Dernière situation du trafic

Nombre total de visites mensuelles

474564576

Taux de rebond

36.20%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:34

llama3v Tendance des visites

llama3v Distribution géographique des visites

llama3v Sources de trafic

llama3v Alternatives