ByteDance ha lanzado recientemente una nueva función para su aplicación Doubao: la comprensión de imágenes. Tanto la aplicación Doubao para móviles como la versión para PC han añadido botones de foto y cámara, permitiendo a los usuarios subir imágenes para que el sistema las identifique.

Modelo de lenguaje grande Doubao de ByteDance y Douyin

La función de comprensión de imágenes de Doubao no se limita al reconocimiento de texto; también analiza el contenido de la imagen, pudiendo incluso comprender e interpretar chistes.

Doubao, como asistente de IA de modelos de lenguaje grandes de ByteDance, ya admite varias funciones, incluyendo la generación de texto e imágenes.

Anteriormente, Doubao se encontraba en fase de prueba interna para la función de generación de vídeo. Según el sitio web oficial de Doubao, esta función permite convertir imágenes y texto en vídeos vívidos y realistas con un solo clic. Los usuarios pueden seleccionar diferentes estilos y proporciones según sus necesidades, añadir efectos dinámicos y de cámara, lograr la coherencia entre múltiples tomas y crear contenido de vídeo único.