InternVL2_5-4B-MPO
Modèle linguistique multimodal de grande taille, affichant des performances globales exceptionnelles.
Produit OrdinaireImageMultimodalGrand modèle linguistique
InternVL2.5-MPO est une série de modèles linguistiques multimodaux de grande taille, construits sur la base d'InternVL2.5 et d'une optimisation de préférence hybride. Ce modèle intègre InternViT, entraîné incrémentalement, et divers grands modèles linguistiques pré-entraînés, tels qu'InternLM 2.5 et Qwen 2.5, utilisant un projecteur MLP initialisé aléatoirement. Il prend en charge les données multi-images et vidéo, et excelle dans les tâches multimodales, capable de comprendre et de générer du contenu textuel lié aux images.
InternVL2_5-4B-MPO Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44