EVE
Modèle visuel-linguistique sans encodeur, efficace et piloté par les données.
Produit OrdinaireProgrammationModèle visuel-linguistiqueSans encodeur
EVE est un modèle visuel-linguistique sans encodeur, développé conjointement par des chercheurs de l'Université de Technologie de Dalian, de l'Institut de Recherche en Intelligence Artificielle de Beijing et de l'Université de Beijing. Il affiche des capacités exceptionnelles pour différentes proportions d'images, surpassant Fuyu-8B et se rapprochant des LVLMs basés sur des encodeurs modulaires. EVE se distingue par son efficacité en termes de données et de formation. Il a été pré-entraîné sur 33M de données publiques et a bénéficié d'un entraînement SFT avec 665 000 données LLaVA pour le modèle EVE-7B, et 1,2 million de données SFT supplémentaires pour le modèle EVE-7B (HD). Le développement d'EVE a adopté une stratégie efficace, transparente et pratique, ouvrant une nouvelle voie aux architectures de décodeurs purs multimodaux.
EVE Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34