InternVL2_5-4B-MPO-AWQ

Modèle linguistique de grande taille multi-modal, optimisant les capacités d'interaction entre l'image et le texte.

Produit OrdinaireImageMultimodalGrand modèle linguistique
InternVL2_5-4B-MPO-AWQ est un grand modèle linguistique multi-modal (MLLM) axé sur l'amélioration des performances du modèle dans les tâches d'interaction image-texte. Ce modèle est basé sur la série InternVL2.5 et ses performances sont encore améliorées grâce à l'optimisation des préférences mixtes (MPO). Il peut traiter de multiples entrées, notamment des images simples et multiples, ainsi que des données vidéo, et convient aux tâches complexes nécessitant une compréhension interactive d'images et de texte. InternVL2_5-4B-MPO-AWQ, grâce à ses capacités multimodales exceptionnelles, offre une solution puissante pour les tâches de conversion image-texte en texte.
Ouvrir le site Web

InternVL2_5-4B-MPO-AWQ Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

InternVL2_5-4B-MPO-AWQ Tendance des visites

InternVL2_5-4B-MPO-AWQ Distribution géographique des visites

InternVL2_5-4B-MPO-AWQ Sources de trafic

InternVL2_5-4B-MPO-AWQ Alternatives