InternVL2_5-26B-MPO

Grand modèle linguistique multimodale améliorant l'interaction visuelle et linguistique.

Produit OrdinaireImageMultimodalGrand modèle linguistique
InternVL2_5-26B-MPO est un grand modèle linguistique multimodale (MLLM) qui, basé sur InternVL2.5, améliore encore ses performances grâce à l'optimisation des préférences mixtes (Mixed Preference Optimization, MPO). Ce modèle peut traiter des données multimodales, notamment des images et du texte, et est largement utilisé dans des scénarios tels que la description d'images et la question-réponse visuelle. Son importance réside dans sa capacité à comprendre et à générer du texte étroitement lié au contenu des images, repoussant ainsi les limites de l'intelligence artificielle multimodale. Les informations contextuelles incluent ses performances exceptionnelles dans les tâches multimodales et les résultats d'évaluation sur OpenCompass Learderboard. Ce modèle offre aux chercheurs et développeurs un outil puissant pour explorer et réaliser le potentiel de l'intelligence artificielle multimodale.
Ouvrir le site Web

InternVL2_5-26B-MPO Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

InternVL2_5-26B-MPO Tendance des visites

InternVL2_5-26B-MPO Distribution géographique des visites

InternVL2_5-26B-MPO Sources de trafic

InternVL2_5-26B-MPO Alternatives