Taiyi-Diffusion-XLは、Stable Diffusionを基に訓練されたオープンソースのバイリンガルテキストツーイメージ生成モデルです。英語と中国語のテキストによる画像生成に対応しており、以前の中国語テキストツーイメージモデルと比べて大幅な性能向上を実現しています。テキストの説明に基づいて写真のように写実的な画像を生成でき、様々な画像スタイルに対応し、高い生成品質と多様性を備えています。本モデルは革新的な訓練方法を採用し、単語表と位置符号を拡張することで長文と中国語に対応させ、大規模バイリンガルデータセットで訓練することで、強力な中国語と英語の生成能力を確保しています。