InternVL2_5-8B

Modèle linguistique de grande taille multimodale, prenant en charge la compréhension interactive d'images et de texte.

Produit OrdinaireImageMultimodalGrand modèle linguistique
InternVL2_5-8B est un grand modèle linguistique multimodal (MLLM) développé par OpenGVLab. Il s'appuie sur InternVL 2.0 avec des améliorations significatives des stratégies d'entraînement et de test, ainsi qu'une meilleure qualité des données. Ce modèle utilise l'architecture 'ViT-MLP-LLM', intégrant InternViT pré-entraîné de manière incrémentale et plusieurs modèles linguistiques pré-entraînés, tels qu'InternLM 2.5 et Qwen 2.5, utilisant un projecteur MLP initialisé aléatoirement. Les modèles de la série InternVL 2.5 affichent des performances exceptionnelles sur les tâches multimodales, notamment la compréhension d'images et de vidéos, et la compréhension multilingue.
Ouvrir le site Web

InternVL2_5-8B Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

InternVL2_5-8B Tendance des visites

InternVL2_5-8B Distribution géographique des visites

InternVL2_5-8B Sources de trafic

InternVL2_5-8B Alternatives