El equipo de modelos de lenguaje grande de Doubao de ByteDance ha lanzado recientemente SeedEdit, el primer modelo de edición de imágenes generalizado del país que se ha implementado como producto. Esta tecnología ya está disponible para pruebas en la versión de escritorio de Doubao y en la versión web de Jimeng. Esta tecnología innovadora permite a los usuarios lograr efectos de edición de imágenes de nivel profesional con simples instrucciones de texto.

image.png

Como herramienta revolucionaria de edición de imágenes, SeedEdit supera las barreras tecnológicas de la edición de imágenes tradicional. Los usuarios pueden realizar fácilmente retoques, cambios de vestuario, embellecimiento, cambios de estilo y la adición o eliminación de elementos en áreas específicas mediante instrucciones en lenguaje natural. Por ejemplo, después de generar una imagen de "un cachorro corriendo en un prado", el usuario solo necesita ingresar la instrucción simple "cambiar el fondo por una playa" para obtener un cambio de escena perfecto.

El equipo de ByteDance ha resuelto de forma innovadora el problema de la escasez de datos durante el desarrollo del modelo. Mediante un esquema de creación de datos multimodelo, multi-escala y multi-estándar, se ha mejorado significativamente la cantidad, la diversidad y la calidad de los datos. En comparación con las tecnologías existentes en la industria, SeedEdit ha logrado avances en versatilidad, controlabilidad y calidad de salida. En particular, en tareas tradicionales como la segmentación de imágenes, las imágenes generadas por SeedEdit son más naturales y carecen de la sensación artificial de "pegado".

image.png

En las pruebas de rendimiento, SeedEdit ha demostrado un excelente desempeño en evaluaciones de referencia como HQ-Edit. No solo puede comprender instrucciones ambiguas, sino que también presenta una mayor tasa de retención y éxito de la imagen al realizar ediciones precisas. Actualmente, el modelo admite la entrada en chino e inglés, y puede identificar con precisión los modismos y nombres propios chinos.

El equipo de Doubao indica que, aunque actualmente SeedEdit funciona mejor con imágenes generadas por modelos que con imágenes reales, el equipo está optimizando continuamente el rendimiento del modelo. En el futuro, se centrará en mejorar el efecto del procesamiento de imágenes reales, la capacidad de retención de ID y la precisión de la edición, y explorará la generación de contenido de historias y cómics de larga secuencia temporal para ofrecer a los usuarios herramientas de creación más potentes.

Dirección de prueba: https://top.aibase.com/tool/seededit