InternVL2_5-8B
Modèle linguistique de grande taille multimodale, prenant en charge la compréhension interactive d'images et de texte.
Produit OrdinaireImageMultimodalGrand modèle linguistique
InternVL2_5-8B est un grand modèle linguistique multimodal (MLLM) développé par OpenGVLab. Il s'appuie sur InternVL 2.0 avec des améliorations significatives des stratégies d'entraînement et de test, ainsi qu'une meilleure qualité des données. Ce modèle utilise l'architecture 'ViT-MLP-LLM', intégrant InternViT pré-entraîné de manière incrémentale et plusieurs modèles linguistiques pré-entraînés, tels qu'InternLM 2.5 et Qwen 2.5, utilisant un projecteur MLP initialisé aléatoirement. Les modèles de la série InternVL 2.5 affichent des performances exceptionnelles sur les tâches multimodales, notamment la compréhension d'images et de vidéos, et la compréhension multilingue.
InternVL2_5-8B Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44