LongVA

Modèle de transformation à long contexte, de la langue à la vision

Produit OrdinaireImageLong contexteModèle visuel
LongVA est un modèle de transformation à long contexte capable de traiter plus de 2000 images ou plus de 200 000 marqueurs visuels. Il affiche des performances de pointe parmi les modèles de 7 milliards de paramètres sur Video-MME. Le modèle a été testé avec CUDA 11.8 et A100-SXM-80G, et peut être rapidement mis en œuvre via la plateforme Hugging Face.
Ouvrir le site Web

LongVA Dernière situation du trafic

Nombre total de visites mensuelles

474564576

Taux de rebond

36.20%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:34

LongVA Tendance des visites

LongVA Distribution géographique des visites

LongVA Sources de trafic

LongVA Alternatives