Récemment, Hedra Labs a lancé une version préliminaire de Character-1, une technologie permettant aux utilisateurs de générer des vidéos dynamiques de personnes parlant ou chantant à partir d'une simple photo et d'un fichier audio.

Imaginez : vous téléchargez une photo, ajoutez un fichier audio, et instantanément, une vidéo dynamique est créée, donnant vie à la photo ! La personne sur la photo parle ou chante, avec une synchronisation parfaite des lèvres, des expressions et des postures avec le contenu audio. Incroyable, n'est-ce pas ?

Vidéo de démonstration officielle de Hedra Labs

Principales caractéristiques et fonctionnalités :

  • Compatibilité multiplateforme : Character-1 est facilement utilisable sur ordinateur et appareils mobiles.

  • Génération de vidéos de durée illimitée : La version préliminaire permet actuellement de générer des vidéos de 30 secondes. Avec un approvisionnement suffisant en H100, il est possible de générer 90 secondes de contenu toutes les 60 secondes.

  • Prise en charge de multiples formes d'expression : Character-1 prend en charge non seulement les dialogues, mais aussi le chant et le rap.

Hedra propose une interface conviviale, accessible même aux non-professionnels. Les utilisateurs peuvent accéder au site web de Hedra, utiliser la fonction de texte-à-parole ou télécharger directement un fichier audio, saisir une description du personnage, puis générer une vidéo dynamique.

La technologie IA de Hedra garantit une vidéo de haute qualité et réaliste, avec une synchronisation parfaite des expressions, des postures et de la voix.

D'après les exemples officiels, Character-1 peut parfaitement interpréter des chansons, jouer des rôles et exprimer différentes émotions. Cette technologie ne se limite pas aux personnages humains ; elle peut même générer des objets inanimés expressifs, pourvu qu'ils possèdent des traits faciaux distincts.

L'utilisation est très simple. Voici les étapes :

Accédez à l'adresse Hedra : https://top.aibase.com/tool/hedra

L'interface utilisateur est présentée sur la page.

image.png

L'interface est simple. Dans la première zone, saisissez le texte pour votre personnage et sélectionnez une voix. Vous pouvez également importer votre propre fichier audio si vous ne souhaitez pas utiliser l'audio généré.

image.png

J'ai simplement saisi : « Salut, ceci est une vidéo parlante créée par AIBase. Aujourd'hui, nous allons découvrir Hedra, qui rend la création vidéo aussi simple que respirer. »

Puis, dans la deuxième zone, j'ai téléchargé une image : une photo de femme que j'avais créée précédemment.

image.png

Si vous n'avez pas d'image, vous pouvez saisir une description de votre personnage dans la zone de texte ci-dessous et cliquer sur « Créer » pour la générer.

Une fois l'image téléchargée, cliquez sur « Générer la vidéo » dans la troisième zone.

image.png

Voici le résultat :

Comme vous pouvez le constater, la vidéo générée par Hedra est assez dynamique. Non seulement la bouche bouge, mais aussi le reste du corps, avec des expressions faciales. Cependant, le choix de voix étant limité, l'accent étranger ne correspond pas très bien à mon image. De plus, la qualité de la vidéo générée est inférieure à celle de l'image originale. J'espère que la plateforme améliorera la qualité d'image à l'avenir.

J'ai ensuite téléchargé mon propre fichier audio, créé avec CapCut, en sélectionnant une voix féminine et en saisissant du texte à lire.

image.png

Nouveau test :

Importation d'un fichier audio

image.png

Résultat :

Le problème de flou peut être résolu avec la fonction d'amélioration vidéo de Krea AI. Cependant, il faut noter que la version gratuite est limitée à 10 secondes. Au-delà, il faut couper la vidéo. De plus, il ne faut pas choisir une fréquence d'images trop élevée. J'avais choisi 60 ips, et l'opération a été interrompue et a demandé une mise à niveau payante. Snif !

image.png