El centro de experiencia de la plataforma abierta Jieyue Xingchen presenta el modelo de generación de imágenes Step-1X, que se presentó por primera vez en la Conferencia Mundial de Inteligencia Artificial de 2024, junto con el modelo de lenguaje Step-2 y el modelo multimodal Step-1.5V. Step-1X colaboró con Shanghai Film para desarrollar una experiencia interactiva H5 basada en la IP clásica de La Rebelión en el Palacio del Mono, capaz de generar imágenes de alta calidad incluso con recursos de datos escasos. Se destaca la alineación semántica profunda y la generación de detalles, empleando la arquitectura de modelo DiT de desarrollo propio, admite la introducción de instrucciones largas y es adecuado para publicidad y juegos.