LLaVA-3b

Produit OrdinaireProgrammationHugging FaceLLaVA-3b

LLaVA-3b est un modèle affiné à partir de Dolphin 2.6 Phi, utilisant une tour visuelle SigLIP 400M affinée selon la méthode LLaVA. Le modèle se caractérise par plusieurs marqueurs d'image et l'utilisation de la sortie de la couche la plus récente de l'encodeur visuel. Ce modèle est basé sur Phi-2, soumis à la licence de recherche Microsoft et son utilisation commerciale est interdite. Nous remercions le ML Collective pour les crédits de ressources de calcul.

Affinage de modèle
Déploiement de modèle
Utilisation dans Transformers

LLaVA-3b peut être utilisé pour la génération de descriptions d'images
les questions-réponses visuelles
et d'autres applications similaires.

Ouvrir le site Web

LLaVA-3b Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

LLaVA-3b Tendance des visites

LLaVA-3b Distribution géographique des visites

Best AI Websites & Tools

LLaVA-3b

LLaVA-3b Dernière situation du trafic

LLaVA-3b Tendance des visites

LLaVA-3b Distribution géographique des visites

LLaVA-3b Sources de trafic

LLaVA-3b Alternatives

LLaVA-3b — LLaVA-3b est un modèle affiné à partir de Dolphin 2.6 Phi, utilisant une tour visuelle SigLIP 400M affinée selon la méthode LLaVA. Le modèle se caractérise par plusieurs marqueurs d'image et l'utilisation de la sortie de la couche la plus récente de l'encodeur visuel.

Llama-3.1-70B-Instruct-AWQ-INT4 — Modèle de génération de texte de 70 milliards de paramètres

Llama-Lynx-70b-4bit-Quantized — Modèle de génération de texte quantifié de 7 milliards de paramètres

Llama-lynx-70b-4bitAWQ — Modèle de génération de texte de 7 milliards de paramètres

glider-gguf — Modèle linguistique quantifié haute performance

FastHunyuan — Modèle de génération vidéo haute qualité rapide

Recursal AI — Rendre l'intelligence artificielle accessible à tous

InternVL2_5-26B — Modèle linguistique de grande taille multi-modalité, fusionnant compréhension visuelle et linguistique.

FineWeb2 — Ensemble de données pré-entraîné multilingue

Interface Web de l'Agent de Traduction — Une interface web d'agent de traduction basée sur Gradio.

PocketPal AI — Application de chat IA offrant une expérience de conversation sécurisée et privée.

OLMo-2-1124-7B-Instruct — Modèle de génération de dialogue anglais haute performance

OLMo 2 7B — Modèle linguistique de grande taille (7 milliards de paramètres) améliorant les capacités de traitement du langage naturel.

Skywork-o1-Open-PRM-Qwen-2.5-1.5B — Modèle de la série Skywork o1 Open, améliorant la résolution de problèmes complexes.

FLUX.1-dev-IP-Adapter — Adaptateur IP basé sur le modèle FLUX.1-dev, offrant une flexibilité comparable à celle du texte pour le traitement d'images.

Adaptateur IP SD3.5-Large — Adaptateur IP basé sur le modèle Stable Diffusion 3.5 Large

Outils de Programmation Qwen2.5 Coder Artifacts — Ensemble d'outils de programmation fournis par Qwen sur Hugging Face

LLaMA-O1 — Framework de modèle d'inférence à grande échelle, compatible avec PyTorch et Hugging Face.

MobileLLM-350M — Modèle linguistique optimisé de moins d'un milliard de paramètres, conçu pour les applications embarquées.

Aya Expanse — Espace Hugging Face développé par CohereForAI

Démo TTS MaskGCT — Démonstration de texte à parole (TTS) basée sur le modèle MaskGCT

Reverb — Code d'inférence de modèles de reconnaissance vocale et de séparation de locuteurs open source.

gradio-bot — Transformez vos applications Hugging Face Space ou Gradio en robots Discord.

Flux.1-dev Controlnet Upscaler — Modèle d'agrandissement d'image basé sur Hugging Face.

Falcon Mamba — Premier modèle de langage à grande échelle de 7 milliards de paramètres, sans mécanisme d'attention.

ComfyUI-KwaiKolorsWrapper — Wrapper Diffusers pour le modèle texte-vers-image Kwai-Kolors

Featherless — Fournisseur de modèles IA, offrant un accès à une riche bibliothèque de modèles Hugging Face.

Florence-2-base-ft — Modèle de base visuel avancé, prenant en charge diverses tâches visuelles et visuelles-linguistiques.

ComfyUI-Hallo — Un nœud ComfyUI personnalisé pour le modèle Hallo.

MathBlackBox — Modèle d'apprentissage profond traitant les mathématiques comme une boîte noire