MiniCPM-V 2.6
Modèle linguistique multimodal haute performance, adapté à la compréhension d'images et de vidéos.
Produit OrdinaireImageMultimodalCompréhension d'images
MiniCPM-V 2.6 est un grand modèle linguistique multimodal basé sur 800 millions de paramètres. Il affiche des performances de pointe dans plusieurs domaines, notamment la compréhension d'images uniques et multiples, et la compréhension de vidéos. Ce modèle a obtenu un score moyen de 65,2 sur plusieurs benchmarks populaires comme OpenCompass, surpassant ainsi de nombreux modèles propriétaires largement utilisés. Il possède également de solides capacités OCR, prend en charge plusieurs langues et offre une efficacité remarquable, permettant la compréhension vidéo en temps réel sur des appareils tels que les iPad.
MiniCPM-V 2.6 Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44