Récemment, un nouveau générateur d'IA texte-vidéo nommé Hotshot a fait sensation. Les résultats vidéo présentés par l'équipe sont tout simplement époustouflants !
Voici un aperçu du résultat :
Ce nouveau modèle Hotshot peut générer des vidéos de 10 secondes maximum en 720p. Il offre une grande flexibilité stylistique, permettant de créer des animations de différents styles, comme des bandes dessinées ou des vidéos de rotoscopie. Ses points forts sont :
Génération de vidéos à partir de texte : les utilisateurs peuvent saisir du texte pour générer des vidéos 720p jusqu'à 10 secondes, permettant une création rapide et facile.
Sorties vidéo sans filigrane : les vidéos générées par les utilisateurs gratuits ne comportent pas de filigrane, offrant ainsi une plus grande liberté aux créateurs.
Styles vidéo variés : Hotshot peut générer des vidéos de styles variés, notamment des styles bande dessinée et des images animées, répondant ainsi aux différents besoins créatifs.
Grande adaptabilité et extensibilité : le modèle a le potentiel d'être étendu à des vidéos plus longues et à des résolutions plus élevées, et pourrait à l'avenir prendre en charge la génération audio.
Solide base technologique : Hotshot a été entraîné sur 600 millions de clips vidéo et a utilisé un grand nombre de GPU pour une génération vidéo efficace.
Ce modèle de génération de vidéos par IA est actuellement en phase de « prévisualisation précoce » publique. Les utilisateurs peuvent tester gratuitement le modèle sur le site officiel de Hotshot. Toutefois, il est important de noter que le nombre de générations est limité à deux vidéos par jour, et que les vidéos générées sont sans filigrane.
L'équipe derrière Hotshot a entraîné le modèle en quatre mois
La startup Hotshot, fondée en 2023, a été créée par trois fondateurs : Aakash Sastry, John Mullan et Duncan Crawbuck.
Sastry a déclaré sur le réseau social X : « Pour la première fois en dix ans, il est possible de créer pour les clients des applications vidéo puissantes et innovantes. » Ce nouveau modèle Hotshot est la base de la réalisation de cet objectif. Ils indiquent qu'il ne s'agit que d'un début et que d'autres surprises seront dévoilées prochainement. Auparavant, Hotshot avait connu le succès avec une application gratuite de création et d'édition de photos par IA pour les consommateurs, mais ils se concentrent désormais sur ce nouveau modèle d'IA texte-vidéo.
Selon Sastry, l'équipe Hotshot a entraîné ce modèle en seulement quatre mois, ce qui n'est pas une mince affaire ! Ils ont utilisé 600 millions de clips vidéo et des milliers de GPU pour l'entraînement. Les défis techniques rencontrés étaient considérables, et les pannes de machines ont parfois été source de maux de tête.
Pour assurer le bon déroulement de l'entraînement du modèle, les membres de l'équipe ont surveillé le processus presque en permanence. Sastry a également indiqué qu'ils exploraient des durées de vidéo plus longues et des résolutions plus élevées, et qu'ils pourraient ajouter des éléments audio à l'avenir.
Selon lui, le contenu généré par l'IA pourrait devenir courant dans les médias numériques dans les 12 prochains mois, notamment dans la création de vidéos YouTube. Les créateurs pourraient ainsi avoir un contrôle total sur le processus de génération, du texte à la vidéo, voire à l'audio.
L'équipe d'AIbase a également testé Hotshot et a constaté que les vidéos générées présentaient un certain potentiel, même si la qualité et les détails pourraient être améliorés par rapport à certains concurrents. Par exemple, avec l'invite « An ice sculptor carving an intricate design, chips flying as they work », le résultat vidéo est le suivant :
Les mouvements de la vidéo sont relativement fluides, mais la netteté pourrait être améliorée. Si vous souhaitez essayer, vous pouvez accéder à l'adresse suivante :
Accès au produit : https://top.aibase.com/tool/hotshot
Points clés :
🌟 Le nouveau générateur d'IA texte-vidéo Hotshot est disponible en phase de « prévisualisation précoce » publique, et les utilisateurs peuvent l'essayer gratuitement.
🚀 Ce modèle a été entraîné en seulement quatre mois à l'aide de 600 millions de clips vidéo et de milliers de GPU, démontrant ainsi un potentiel considérable.
🎥 Le fondateur Sastry prévoit que les vidéos YouTube complètes générées par l'IA seront courantes dans l'année à venir, offrant ainsi aux créateurs un plus grand contrôle.