Am 19. Dezember veröffentlichte Google das Video-Generierungsmodell VideoPoet. Dieses Modell kann Videos mit einer Länge von bis zu 10 Sekunden erstellen und gleichzeitig automatisch passende Musik und Soundeffekte zum Videomaterial generieren. VideoPoet verlängert Videos, indem es wiederholt die nächste Frame basierend auf der letzten Frame vorhersagt, wodurch der Eindruck entsteht, dass das Video unbegrenzt verlängert werden kann. Im Gegensatz zu anderen Modellen verwendet VideoPoet ein großes Sprachmodell anstelle eines Diffusionsmodells. Daher integriert es Funktionen wie Text-zu-Video, Videoreparatur und Videostyling in einem einzigen Modell, was eine flexiblere Anwendung ermöglicht.
Google veröffentlicht VideoPoet, ein Video-Generierungsmodell für bis zu 10 Sekunden lange Videos und Audio

36氪
Dieser Artikel stammt aus dem AIbase-Tagesbericht
Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.