InternVL2_5-4B-MPO-AWQ
Modèle linguistique de grande taille multi-modal, optimisant les capacités d'interaction entre l'image et le texte.
Produit OrdinaireImageMultimodalGrand modèle linguistique
InternVL2_5-4B-MPO-AWQ est un grand modèle linguistique multi-modal (MLLM) axé sur l'amélioration des performances du modèle dans les tâches d'interaction image-texte. Ce modèle est basé sur la série InternVL2.5 et ses performances sont encore améliorées grâce à l'optimisation des préférences mixtes (MPO). Il peut traiter de multiples entrées, notamment des images simples et multiples, ainsi que des données vidéo, et convient aux tâches complexes nécessitant une compréhension interactive d'images et de texte. InternVL2_5-4B-MPO-AWQ, grâce à ses capacités multimodales exceptionnelles, offre une solution puissante pour les tâches de conversion image-texte en texte.
InternVL2_5-4B-MPO-AWQ Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44