ByteDance hat kürzlich eine neue Funktion für seine Doubao-App vorgestellt: das Bildverständnis. Die Doubao-App und die PC-Version verfügen nun über neue Schaltflächen für Fotos und Kameras. Benutzer können Bilder hochladen, um deren Inhalt vom System analysieren zu lassen.

ByteDance Douyin Doubao großes Sprachmodell

Doubao, ein großes Sprachmodell-KI-Assistent von ByteDance, unterstützt bereits Funktionen wie Textgenerierung und Bildgenerierung.

Zuvor befand sich die Videogenerierungsfunktion von Doubao bereits in der internen Testphase. Auf der Doubao-Website heißt es, dass die Videogenerierungsfunktion Bilder und Texte mit einem Klick in lebensechte Videos umwandeln kann. Benutzer können je nach Bedarf verschiedene Stile und Formate auswählen, dynamische Elemente und Kamerabewegungen hinzufügen und die Konsistenz über mehrere Aufnahmen hinweg gewährleisten, um einzigartige Videoinhalte zu erstellen.