Uni3D : Un modèle de vision 3D universel

L'Institut de Recherche sur l'Intelligence Artificielle (AIRS) a récemment publié en open source Uni3D, un modèle de vision 3D universel doté de 10 milliards de paramètres. Ce modèle est capable de traiter les données de nuages de points et a réalisé une percée technologique globale dans les principales tâches de vision 3D, démontrant des capacités de vision universelle exceptionnelles.

L'équipe de recherche et développement d'Uni3D s'est inspirée de l'expérience de conception des modèles de vision 2D et a introduit une méthode d'entraînement d'alignement multimodal. Cela permet à Uni3D d'hériter directement des connaissances acquises par les modèles de vision 2D, lui conférant de puissantes capacités de vision 3D.

Ce modèle a obtenu des résultats de pointe (state-of-the-art) sur diverses tâches de vision 3D, démontrant sa grande généralisation et ses capacités d'apprentissage par transfert. L'Institut de Recherche sur l'Intelligence Artificielle a déclaré que la publication en open source d'Uni3D jetait des bases solides pour les futures recherches et applications en vision par ordinateur 3D.