Step-1X, le modèle de génération d'images très attendu de Jieyue Xingchen, est désormais disponible sur son centre d'expérience de plateforme ouverte. L'accès se fait via un simple enregistrement. Ce modèle a été présenté pour la première fois lors de la Conférence mondiale sur l'intelligence artificielle de 2024, aux côtés du modèle linguistique Step-2 (avec des milliards de paramètres) et du modèle multi-modal Step-1.5V.

Step-1X collabore avec Shanghai Film pour développer une expérience interactive H5, « Découvrez quel dieu vous êtes », basée sur l'IP classique « La révolte du palais de jade ». Malgré la rareté des données sur « La révolte du palais de jade », Step-1X réussit à générer des images de haute qualité avec des ressources limitées.

filename.png

Step-1X met l'accent sur l'alignement sémantique profond et la génération de détails. Il utilise l'architecture de modèle DiT (Diffusion Models with Transformer) développée en interne, ce qui lui permet de comprendre des instructions complexes et de prendre en charge des instructions de génération d'images jusqu'à 2000 caractères.

Sa flexibilité le rend largement applicable à divers scénarios, tels que la création publicitaire, les graphismes de jeux et la production cinématographique. Il présente des avantages d'optimisation uniques, notamment pour le traitement des éléments et de la culture chinois, permettant une meilleure transmission de l'essence culturelle.

Lien d'expérience : https://platform.stepfun.com/console-tools?model=step-1x-medium