InternVL2_5-1B
Modèle linguistique de grande taille multimodale, prenant en charge la compréhension d'images et de texte.
Produit OrdinaireImageMultimodalGrand modèle linguistique
InternVL 2.5 est une série de modèles linguistiques de grande taille multimodaux (MLLM) de pointe. S'appuyant sur InternVL 2.0, il conserve son architecture de modèle principale tout en bénéficiant d'améliorations significatives des stratégies d'entraînement et de test, ainsi que de la qualité des données. Ce modèle intègre InternViT, entraîné de manière incrémentale, avec divers modèles linguistiques de grande taille (LLM) pré-entraînés, tels qu'InternLM 2.5 et Qwen 2.5, en utilisant un projecteur MLP initialisé aléatoirement. InternVL 2.5 prend en charge les données multi-images et vidéo, et sa capacité à traiter les données multimodales est renforcée par une méthode d'entraînement dynamique à haute résolution.
InternVL2_5-1B Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44