Taiyi-Diffusion-XL es un modelo de generación de imágenes a partir de texto bilingüe de código abierto, entrenado con Stable Diffusion. Admite la generación de imágenes a partir de texto en inglés y chino, mostrando una mejora significativa respecto a modelos previos de generación de imágenes a partir de texto en chino. Puede generar imágenes fotorealistas a partir de descripciones de texto, admite diversos estilos de imagen y ofrece una alta calidad y diversidad en la generación. El modelo emplea un método de entrenamiento innovador, expandiendo el vocabulario y la codificación posicional para admitir textos largos y en chino, y se entrenó en un conjunto de datos bilingüe a gran escala, lo que garantiza su potente capacidad de generación en chino e inglés.