EVE

Modèle visuel-linguistique sans encodeur, efficace et piloté par les données.

Produit OrdinaireProgrammationModèle visuel-linguistiqueSans encodeur
EVE est un modèle visuel-linguistique sans encodeur, développé conjointement par des chercheurs de l'Université de Technologie de Dalian, de l'Institut de Recherche en Intelligence Artificielle de Beijing et de l'Université de Beijing. Il affiche des capacités exceptionnelles pour différentes proportions d'images, surpassant Fuyu-8B et se rapprochant des LVLMs basés sur des encodeurs modulaires. EVE se distingue par son efficacité en termes de données et de formation. Il a été pré-entraîné sur 33M de données publiques et a bénéficié d'un entraînement SFT avec 665 000 données LLaVA pour le modèle EVE-7B, et 1,2 million de données SFT supplémentaires pour le modèle EVE-7B (HD). Le développement d'EVE a adopté une stratégie efficace, transparente et pratique, ouvrant une nouvelle voie aux architectures de décodeurs purs multimodaux.
Ouvrir le site Web

EVE Dernière situation du trafic

Nombre total de visites mensuelles

474564576

Taux de rebond

36.20%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:34

EVE Tendance des visites

EVE Distribution géographique des visites

EVE Sources de trafic

EVE Alternatives