PixelLLM

Modèle linguistique d'alignement de pixels

Produit OrdinaireImageLocalisation d'imageModèle linguistique

PixelLLM est un modèle vision-langage conçu pour les tâches de localisation d'image. Ce modèle peut générer une description textuelle à partir d'une position d'entrée, ou générer des coordonnées de pixels pour une localisation précise à partir d'une description textuelle. Pré-entraîné sur l'ensemble de données Localized Narrative, le modèle apprend la correspondance entre les mots et les pixels de l'image. PixelLLM peut être appliqué à diverses tâches de localisation d'image, notamment la description conditionnelle à la localisation, la localisation par indication et la description dense d'objets, atteignant des performances de pointe sur des ensembles de données tels que RefCOCO et Visual Genome.

Best AI Websites & Tools

PixelLLM

PixelLLM Dernière situation du trafic

PixelLLM Tendance des visites

PixelLLM Distribution géographique des visites

PixelLLM Sources de trafic

PixelLLM Alternatives

PixelLLM — Modèle linguistique d'alignement de pixels

Instella — Instella est un modèle linguistique open source haute performance développé par AMD, conçu pour accélérer le développement des modèles linguistiques open source.

Moonlight-16B-A3B — Moonlight-16B-A3B est un modèle d'expert mixte de 16 milliards de paramètres, entraîné avec l'optimiseur Muon, conçu pour une génération de langage efficace.

Xwen-Chat — Xwen-Chat est un ensemble de modèles linguistiques de grande taille spécialisé dans les dialogues en chinois, offrant plusieurs versions de modèles et des services de génération de langage.

MiniMax-01 — Modèle linguistique puissant disposant de 456 milliards de paramètres au total, capable de traiter un contexte jusqu'à 4 millions de jetons.

YuLan-Mini — Un modèle linguistique léger et performant de 240 millions de paramètres

OLMo-2-1124-13B-DPO — Modèle linguistique performant pour l'anglais, adapté à diverses tâches.

OpenScholar — Modèle linguistique amélioré par la recherche pour la synthèse de littérature scientifique

OLMo 2 13B — Modèle linguistique performant spécialisé dans les benchmarks académiques anglais

OLMo 2 — Modèle linguistique entièrement ouvert de pointe

MobileLLM-1B — Modèle linguistique de Meta comportant moins d'un milliard de paramètres, adapté aux applications embarquées.

MobileLLM-350M — Modèle linguistique optimisé de moins d'un milliard de paramètres, conçu pour les applications embarquées.

Zamba2-7B — Modèle linguistique compact haute performance

Échantillonnage basé sur l'entropie — Technique d'échantillonnage basée sur l'entropie, optimisant la diversité et la précision des sorties du modèle.

Discutez avec vos documents — Application Python permettant une conversation en langage naturel avec vos documents.

Meta Llama 3.1-405B — Grand modèle linguistique préentraîné multilingue

DCLM-baseline — Jeu de données de référence pour les modèles linguistiques performants

Arcee Spark — Modèle linguistique performant et compact de 7 milliards de paramètres

Prédiction multi-jetons — Modèle de prédiction multi-jetons améliorant l'efficacité et les performances des modèles linguistiques.

Samba — Implémentation officielle d'un modèle linguistique efficace à contexte illimité.

MAP-NEO — Un grand modèle linguistique entièrement open source, offrant des capacités avancées de traitement du langage naturel.

Modèle linguistique fiable (MLF) — Essayez le Modèle linguistique fiable (MLF) de Cleanlab dans votre navigateur.

LLaVA++ — Extension du modèle LLaVA intégrant Phi-3 et LLaMA-3 pour améliorer l'interaction entre la vision et le langage.

OpenELM — OpenELM est une famille de modèles linguistiques performants, dotée d'un framework open source pour l'entraînement et l'inférence.

Cappy — Un petit évaluateur pour améliorer les performances des grands modèles linguistiques multitâches.

H2O-Danube-1.8B — Modèle linguistique de 1,8 milliard de paramètres, open source et gratuit

LLMs-from-scratch — Comprendre en profondeur le fonctionnement interne des grands modèles de langage

Baichuan 3 — Modèle linguistique de grande taille avec plus de mille milliards de paramètres

Recherche Lepton — Lepton est une plateforme de recherche de modèles linguistiques open source.

MaLA-500 — Modèle linguistique de grande taille couvrant 534 langues