Apollo-LMMs
Exploration de la compréhension vidéo dans les grands modèles multimodaux
Produit OrdinaireVidéoCompréhension vidéoModèles multimodaux
Apollo est une famille de modèles multimodaux de pointe, axés sur la compréhension vidéo. En explorant systématiquement l'espace de conception des modèles vidéo-LMM, il révèle les facteurs clés influençant les performances et offre des informations pratiques pour optimiser les performances du modèle. Apollo, grâce à la découverte de la « Cohérence d'Échelle », permet aux décisions de conception prises sur des modèles et des ensembles de données plus petits d'être transférées de manière fiable à des modèles plus grands, réduisant considérablement les coûts de calcul. Les principaux avantages d'Apollo incluent des décisions de conception efficaces, un plan d'entraînement optimisé et un mélange de données, ainsi qu'un nouveau benchmark, ApolloBench, pour une évaluation efficace.
Apollo-LMMs Dernière situation du trafic
Nombre total de visites mensuelles
1938
Taux de rebond
70.30%
Nombre moyen de pages par visite
1.0
Durée moyenne de la visite
00:00:00