Pippo

Pippo est un modèle génératif capable de produire des vidéos haute résolution multi-vues à partir d'une seule photo.

Produit OrdinaireImageGénération d'imagesVidéo multi-vues

Pippo est un modèle génératif développé en collaboration entre Meta Reality Labs et plusieurs universités. Il permet de générer des vidéos haute résolution multi-vues à partir d'une simple photo, sans nécessiter d'entrée supplémentaire (comme des modèles paramétriques ou des paramètres de caméra). Son principal atout réside dans la génération de vidéos de qualité en résolution 1K. Basé sur une architecture de transformateur de diffusion multi-vues, il offre des perspectives d'application vastes, notamment dans la réalité virtuelle et la production cinématographique. Le code de Pippo est open source, mais les poids pré-entraînés ne sont pas inclus ; les utilisateurs doivent donc entraîner le modèle eux-mêmes.

Ouvrir le site Web

Pippo Dernière situation du trafic

Nombre total de visites mensuelles

521149929

Taux de rebond

35.96%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:29

Pippo Tendance des visites

Pippo Distribution géographique des visites

Actualités IA

IA Quotidien

Chronologie de l'IA

Al hardware

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu

Pippo

Pippo Dernière situation du trafic

Pippo Tendance des visites

Pippo Distribution géographique des visites

Pippo Sources de trafic

Pippo Alternatives

Pippo — Pippo est un modèle génératif capable de produire des vidéos haute résolution multi-vues à partir d'une seule photo.

InfiniteYou — Permet une génération d'images flexible et haute fidélité, tout en préservant les caractéristiques d'identité.

TokenVerse — TokenVerse est une méthode personnalisée multi-concept basée sur un modèle de diffusion pré-entraîné texte-vers-image.

CreatiLayout — Technique de génération d'images à partir d'une mise en page créative basée sur un transformateur de diffusion multimodale jumelée.

VMix — Outil d'amélioration de la qualité esthétique des modèles de diffusion texte-image

DiffSensei — Modèle de génération de mangas personnalisé, connectant les LLM multimodaux et les modèles de diffusion.

Leffa — Modèle de génération d'images de personnages contrôlables

ComfyUI_HelloMeme — Outil de génération d'images et de vidéos basé sur un modèle de diffusion

CAT4D — Outil de création de scènes 4D utilisant un modèle de diffusion vidéo multi-vues

stable-diffusion-3.5-large-turbo — Modèle de génération d'images à partir de texte haute performance

stable-diffusion-3.5-large — Modèle de génération d'images à partir de texte haute performance

ACE : Créateur et Éditeur Polyvalent Suivant les Instructions via Transformateur de Diffusion — Créateur et éditeur polyvalent capable de suivre les instructions via un transformateur de diffusion.

Peinture Inverse — Technique de peinture inverse, reconstituant le processus de création d'une œuvre.

HelloMeme — Intègre l'attention tissée spatiale pour améliorer la fidélité conditionnelle des modèles de diffusion.

Extension d'image Diffusers Outpaint — Extension d'image basée sur un modèle de diffusion.

OmniGen — Framework unifié de génération d'images, simplifiant la génération d'images multitâches.

RodinHD — Modèle de génération d'avatars 3D haute fidélité

Flash Diffusion — Modèle de diffusion permettant de générer rapidement des images de haute qualité.

Hallo — Technique d'animation d'images de portraits basée sur un modèle de diffusion

Era3D — Modèle de diffusion multi-vues haute résolution utilisant un mécanisme d'attention par ligne efficace.

CAT3D — Création de scènes 3D à partir d'images multi-vues

MuLan — MuLan : modèle de diffusion multilingue adapté à plus de 110 langues

IDM-VTON — Modèle de diffusion pour les tâches d'essayage virtuel, améliorant particulièrement la fidélité et la conservation des détails des images dans des scénarios du monde réel.

Imagine Flash — Génère des échantillons haute-fidélité et diversifiés en très peu d'étapes.

Diffusion-RWKV — Modèle de diffusion extensible basé sur l'architecture RWKV

DreamWalk — Contrôle granulaire du style d'images perceptuelles basées sur du texte grâce à la diffusion guidée.

VAR — Modélisation Autoregressive Visuelle : un nouveau paradigme de génération d'images

SLD (Modèles de diffusion autocorrecteurs contrôlés par LLM) — Implémentation officielle des modèles de diffusion autocorrecteurs contrôlés par LLM.

DistriFusion — Accélération de l'inférence des modèles de diffusion haute résolution

Diffusion par Réseau Neuronal — Implémentation d'un modèle de diffusion par réseau neuronal.