InternVL2_5-2B
Modèle linguistique de grande taille multi-modal, prenant en charge une interaction approfondie entre images et texte.
Produit OrdinaireImageMultimodalGrand modèle linguistique
InternVL 2.5 est une série de modèles linguistiques de grande taille multi-modaux avancés. S'appuyant sur InternVL 2.0, il préserve son architecture de modèle principale tout en bénéficiant d'améliorations significatives des stratégies d'entraînement et de test, et de la qualité des données. Ce modèle intègre InternViT, entraîné avec des données supplémentaires, et divers grands modèles linguistiques pré-entraînés tels qu'InternLM 2.5 et Qwen 2.5, en utilisant un projecteur MLP initialisé aléatoirement. InternVL 2.5 prend en charge les données multi-images et vidéo, dispose d'une méthode d'entraînement dynamique à haute résolution et offre de meilleures performances pour le traitement des données multi-modales.
InternVL2_5-2B Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44