上海階躍星辰智能科技有限公司は先日、画像生成モデルStep-1Xシリーズのメジャーアップデートを発表し、性能が向上したStep-1X-Medium版をリリースしました。このアップグレード版は、MMDitアーキテクチャに基づき、生成速度が30%以上向上するなど、多くの点で顕著な改善が見られます。また、ターゲットを絞ったトレーニングにより、理解力とテキストと画像の一貫性が向上し、より自然で細部までこだわった画像が生成されるようになりました。

Step-1X-Mediumには、「画像から画像生成」機能が追加されました。ユーザーは画像をアップロードして簡単な指示を与えるだけで、元の画像の詳細を強化したり、スタイルを変換したり、部分的に修正したりできます。さらに、新バージョンでは「中国風」コンテンツ作成機能も強化され、東洋人の表情をより的確に捉え、より高度で繊細な画像表現を実現しています。また、Step-1X-Mediumはプロンプトに英語を追加できるため、生成される画像に英語のテキストを含めることができます。

アップグレードされたStep-1X-Mediumは、クリエイターのパートナーとなることを目指し、入力されたアイデアを深く理解し、より正確で完璧な出力を提供します。現在、Step-1X-Mediumの新機能は、階躍星辰オープン・プラットフォームの「体験センター」でAPI呼び出しを通じて利用可能です。

微信截图_20241226081214.png

新バージョンのStep-1X-Mediumは、生成品質において新たなレベルに到達し、より多様なシーンを生成できるようになり、テキストと画像の一貫性も向上しました。また、東洋人の人物像を深く最適化し、中国風を簡単に表現できるため、中国アニメ、日本アニメ、アメリカンコミック愛好家にとって、スタイルに統一感のある漫画ページを生成することができます。ブランドデザイナーにとって、Step-1X-Mediumはブランドのトーンに合った広告、製品パッケージ、マーケティング素材を生成し、ブランドの文化的な核をより効果的に表現することができます。

Step-1X-Mediumに導入された「下絵」機能により、クリエイターはベースとなる画像をアップロードでき、モデルは画像の構造とスタイルを迅速に理解し、元のアイデアに基づいて詳細の強化、スタイルの変換、または部分的な修正を行うことができます。さらに、Step-1X-MediumはSRef(スタイル参照)生成機能にも対応しており、スタイル参照画像を提供することで、モデルは美学的なスタイルと雰囲気の特徴を抽出し、生成された画像の構図に反映します。

AI技術の進歩により、Step-1X-Mediumではプロンプトに短い英語のテキストを追加して、画像作品にアクセントを加えることができます。このアップグレードは、画像生成の品質と効率を向上させるだけでなく、クリエイターにより多くの創造的な空間と可能性を提供します。

体験アドレス:https://platform.stepfun.com/