L4GM
Modèle de reconstruction 4D de grande taille, générant rapidement des objets animés
Nouveau Produit PremiumImageReconstruction 4DGénération d'animations
L4GM est un modèle de reconstruction 4D de grande taille capable de générer rapidement des objets animés à partir d'une entrée vidéo monoculaire. Il utilise un nouvel ensemble de données contenant des vidéos multivues montrant des objets animés rendus dans Objaverse. Cet ensemble de données comprend 44 000 objets différents et 110 000 animations, rendus à partir de 48 points de vue, générant 12 millions de vidéos contenant au total 300 millions d'images. L4GM est basé sur le modèle de reconstruction 3D de grande taille pré-entraîné LGM, capable de produire des ellipsoïdes gaussiens 3D à partir d'entrées d'images multivues. L4GM produit une représentation 3D Gaussian Splatting pour chaque image, puis la sur-échantillonne à un taux d'images plus élevé pour assurer une fluidité temporelle. De plus, L4GM ajoute une couche d'auto-attention temporelle pour aider à apprendre la cohérence temporelle et utilise une perte de rendu multivue à chaque pas de temps pour entraîner le modèle.
L4GM Dernière situation du trafic
Nombre total de visites mensuelles
206694
Taux de rebond
62.15%
Nombre moyen de pages par visite
1.8
Durée moyenne de la visite
00:00:49