InternLM-XComposer-2.5
Un modèle linguistique visuel de grande taille multifonctionnel
Nouveau Produit PremiumProductivitéModèle linguistique visuelTraitement de longs contextes
InternLM-XComposer-2.5 est un modèle linguistique visuel de grande taille multifonctionnel prenant en charge les entrées et sorties de longs contextes. Il excelle dans diverses applications de compréhension et de création d'images et de textes, atteignant un niveau comparable à GPT-4V, mais en utilisant uniquement un backend LLM de 7 milliards de paramètres. Entraîné sur 24 000 contextes texte-image entrelacés, il peut s'étendre de manière transparente à des contextes longs de 96 000 jetons grâce à l'extrapolation RoPE. Cette capacité de long contexte le rend particulièrement performant dans les tâches nécessitant un large contexte d'entrée et de sortie. De plus, il prend en charge la compréhension d'images à très haute résolution, la compréhension vidéo granulaire, les dialogues multimodaux et multitours, la création de pages web et la rédaction d'articles de haute qualité combinant texte et images.
InternLM-XComposer-2.5 Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34