Le 19 décembre, Google a lancé VideoPoet, un modèle de génération de vidéos. Ce modèle peut générer des vidéos d'une durée allant jusqu'à 10 secondes, et peut également générer automatiquement des musiques et des effets sonores en fonction du contenu vidéo. VideoPoet prolonge les vidéos en prédisant de manière répétitive l'image suivante à partir de la dernière image, donnant l'impression à l'utilisateur que la vidéo peut être prolongée indéfiniment. Contrairement à d'autres modèles, VideoPoet utilise un grand modèle linguistique plutôt qu'un modèle de diffusion, ce qui permet d'intégrer plusieurs fonctionnalités telles que la conversion de texte en vidéo, la réparation vidéo et la stylisation vidéo dans un seul et même modèle, offrant ainsi une plus grande flexibilité d'utilisation.