MiniCPM-V 2.6

Modèle linguistique multimodal haute performance, adapté à la compréhension d'images et de vidéos.

Produit OrdinaireImageMultimodalCompréhension d'images
MiniCPM-V 2.6 est un grand modèle linguistique multimodal basé sur 800 millions de paramètres. Il affiche des performances de pointe dans plusieurs domaines, notamment la compréhension d'images uniques et multiples, et la compréhension de vidéos. Ce modèle a obtenu un score moyen de 65,2 sur plusieurs benchmarks populaires comme OpenCompass, surpassant ainsi de nombreux modèles propriétaires largement utilisés. Il possède également de solides capacités OCR, prend en charge plusieurs langues et offre une efficacité remarquable, permettant la compréhension vidéo en temps réel sur des appareils tels que les iPad.
Ouvrir le site Web

MiniCPM-V 2.6 Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

MiniCPM-V 2.6 Tendance des visites

MiniCPM-V 2.6 Distribution géographique des visites

MiniCPM-V 2.6 Sources de trafic

MiniCPM-V 2.6 Alternatives