Taiyi-Diffusion-XL é um modelo de geração de imagens de código aberto baseado no Stable Diffusion, treinado para gerar imagens a partir de texto em inglês e chinês. Em comparação com modelos anteriores de geração de imagens a partir de texto em chinês, apresenta uma melhoria significativa. Ele pode gerar imagens fotorealísticas com base em descrições de texto, suporta diversos estilos de imagem e possui alta qualidade e diversidade de geração. O modelo emprega um método de treinamento inovador, expandindo o vocabulário e o código de posição para suportar textos longos e chinês, e foi treinado em um amplo conjunto de dados bilíngues, garantindo sua forte capacidade de geração em chinês e inglês.