MiniCPM-o

MiniCPM-o 2.6 : un MLLM (Modèle Linguistique Multimodal) de niveau GPT-4o, capable de réaliser des diffusions en direct visuelles, vocales et multimodales sur un téléphone portable.

Nouveau Produit PremiumAutreMultimodalModèle linguistique
MiniCPM-o 2.6 est le dernier modèle linguistique multimodal (MLLM) à grande échelle développé par l'équipe OpenBMB. Avec 8 milliards de paramètres, il permet de réaliser des diffusions en direct visuelles, vocales et multimodales de haute qualité sur des appareils mobiles tels que les téléphones. Ce modèle, construit sur SigLip-400M, Whisper-medium-300M, ChatTTS-200M et Qwen2.5-7B, est entraîné de manière bout en bout et offre des performances comparables à GPT-4o-202405. Ses principaux avantages incluent des capacités visuelles de pointe, des capacités vocales avancées, de puissantes capacités de diffusion multimodale en direct, une puissante capacité OCR et une efficacité supérieure. Ce modèle est open source et gratuit, utilisable à des fins de recherche académique et commerciales.
Ouvrir le site Web

MiniCPM-o Dernière situation du trafic

Nombre total de visites mensuelles

474564576

Taux de rebond

36.20%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:34

MiniCPM-o Tendance des visites

MiniCPM-o Distribution géographique des visites

MiniCPM-o Sources de trafic

MiniCPM-o Alternatives