InternVL2_5-26B-MPO
Grand modèle linguistique multimodale améliorant l'interaction visuelle et linguistique.
Produit OrdinaireImageMultimodalGrand modèle linguistique
InternVL2_5-26B-MPO est un grand modèle linguistique multimodale (MLLM) qui, basé sur InternVL2.5, améliore encore ses performances grâce à l'optimisation des préférences mixtes (Mixed Preference Optimization, MPO). Ce modèle peut traiter des données multimodales, notamment des images et du texte, et est largement utilisé dans des scénarios tels que la description d'images et la question-réponse visuelle. Son importance réside dans sa capacité à comprendre et à générer du texte étroitement lié au contenu des images, repoussant ainsi les limites de l'intelligence artificielle multimodale. Les informations contextuelles incluent ses performances exceptionnelles dans les tâches multimodales et les résultats d'évaluation sur OpenCompass Learderboard. Ce modèle offre aux chercheurs et développeurs un outil puissant pour explorer et réaliser le potentiel de l'intelligence artificielle multimodale.
InternVL2_5-26B-MPO Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44