Shanghai Jieyue Xingchen Intelligent Technology Co., Ltd. ha anunciado recientemente una importante actualización de su modelo de generación de imágenes Step-1X, lanzando la versión Step-1X-Medium con un rendimiento mejorado. Esta versión actualizada presenta mejoras significativas en varios aspectos: basada en la arquitectura MMDit, la velocidad de generación se ha incrementado en más del 30%; gracias a un entrenamiento específico, la nueva versión presenta una mayor capacidad de comprensión y coherencia entre texto e imagen, generando imágenes con una textura y detalles más naturales.

Step-1X-Medium incorpora la función "imagen a imagen", que permite a los usuarios subir una imagen y proporcionar instrucciones sencillas para mejorar los detalles, cambiar el estilo o modificar partes de la imagen original. Además, la nueva versión ha mejorado su capacidad de creación de contenido "estilo chino", pudiendo capturar mejor la esencia de los rostros orientales y presentar una textura de imagen más refinada y detallada. Step-1X-Medium también admite la inclusión de texto en inglés en el Prompt, permitiendo que las imágenes generadas incluyan textos en inglés.

La versión actualizada de Step-1X-Medium está diseñada para ser una herramienta poderosa para los creadores, comprendiendo en profundidad las ideas introducidas y ofreciendo resultados más precisos y perfectos. Actualmente, las nuevas capacidades de Step-1X-Medium están disponibles para los usuarios a través de la API en el "Centro de Experiencia" de la plataforma abierta de Jieyue Xingchen.

微信截图_20241226081214.png

La nueva versión de Step-1X-Medium ha alcanzado un nuevo nivel en la calidad de generación, capaz de producir escenas más diversas con una mayor coherencia entre texto e imagen. También optimiza en profundidad las imágenes de personajes orientales, dominando fácilmente el estilo chino y generando páginas de cómics con estilos consistentes para los amantes del cómic chino, japonés y estadounidense. Para los diseñadores de marcas, Step-1X-Medium puede generar anuncios, embalajes de productos y materiales de marketing que se ajusten a la identidad de la marca, mostrando mejor su esencia cultural.

La función "imagen base" de Step-1X-Medium permite a los creadores subir imágenes base, y el modelo comprende rápidamente la estructura y el estilo de la imagen, mejorando los detalles, transformando el estilo o realizando retoques parciales sobre la base de la creatividad de la imagen original. Además, Step-1X-Medium admite la función de generación SRef (referencia de estilo), proporcionando una imagen de referencia de estilo para que el modelo extraiga las características estéticas y atmosféricas y las integre en la composición de la imagen generada.

El avance de la tecnología de IA permite a Step-1X-Medium añadir textos cortos en inglés al Prompt, añadiendo detalles a las imágenes. Esta actualización no solo mejora la calidad y la eficiencia de la generación de imágenes, sino que también ofrece a los creadores más espacio creativo y posibilidades.

Dirección de prueba: https://platform.stepfun.com/