階躍星辰は先日、そのオープンなプラットフォーム体験センターにおいて、期待が高まっていた画像生成大規模モデルStep-1Xを正式にリリースしました。ユーザー登録後すぐに体験いただけます。この大規模モデルは、2024年の世界人工知能大会で初めて発表され、数兆パラメーターの言語大規模モデルStep-2、およびマルチモーダル大規模モデルStep-1.5Vと共に公開されました。

今回、Step-1X画像生成大規模モデルは上海映画と協力し、古典的なIPである『大鬧天宮』を基にしたH5インタラクティブ体験「あなたはどの神仙?」を開発しました。『大鬧天宮』のデータ資源は乏しいものの、Step-1Xは限られたデータ条件下でも高品質な画像生成を実現しています。

filename.png

Step-1Xは、深層的な意味の整合性と細部の生成を重視しており、独自開発のDiT(Diffusion Models with Transformer)モデルアーキテクチャを採用しています。複雑な指示を正確に理解し、最大2000文字の画像生成指示に対応可能です。

その柔軟性から、広告クリエイティブ、ゲーム美術、映画制作など、幅広いシーンで活用できます。特に中国の要素や文化を扱う際には、Step-1Xは独自の最適化された利点を示し、文化のエッセンスをより効果的に表現できます。

体験リンク:https://platform.stepfun.com/console-tools?model=step-1x-medium