ByteDance a récemment lancé une nouvelle fonctionnalité pour son application Doubao : la compréhension d'images. L'application Doubao et sa version PC ont été enrichies de boutons « Photo » et « Appareil photo », permettant aux utilisateurs de télécharger des images pour que le système en identifie le contenu. La fonctionnalité de compréhension d'images de Doubao ne se limite pas à la reconnaissance de texte ; elle peut également analyser le contenu des images, et même comprendre et expliquer des blagues.

Modèle linguistique volumineux Doubao de ByteDance

Doubao, l'assistant IA basé sur un grand modèle linguistique de ByteDance, prend déjà en charge plusieurs fonctionnalités, telles que la génération de texte et la génération d'images.

Auparavant, Doubao était en phase de test bêta pour la fonctionnalité de génération de vidéos. Le site web de Doubao indique que cette fonctionnalité permet de convertir des images et du texte en vidéos réalistes en un seul clic. Les utilisateurs peuvent choisir différents styles et proportions selon leurs besoins, ajouter des effets dynamiques et de caméra, assurer la cohérence entre les différents plans et créer ainsi des contenus vidéo uniques.