今週、阿里雲通義万相チームは、ユーザーにより便利でスマートな画像生成と編集サービスを提供することを目的とした、全く新しい画像編集モデルACEを発表しました。ユーザーは簡単な口語的な指示だけで画像を生成または修正でき、画像編集の複雑さを大幅に簡素化します。このツールは、スタイル写真、分鏡制作、室内デザインなど、幅広い用途に対応しています。
ACEモデルは、テキストから画像を生成する(テキスト生成画像)機能だけでなく、強力な画像編集機能も備えています。ユーザーは対話形式で、制御可能な視覚編集、要素の変更、領域の再描画、レイヤー編集などのタスクを実行できます。
例えば、「証明写真の背景を変更」や「ワンクリックで透かしを削除」などの指示を入力するだけで、Photoshopのような機能を簡単に実現できます。注目すべきは、ACEの局所的なスタイル変更機能が通義Appで既に利用可能になり、ユーザーエクスペリエンスがさらに向上していることです。
公式の説明によると、ACEモデルの中核となる革新は、独自のLong-context Condition Unit(LCU)モジュールにあります。LCUは多様なモーダル条件入力に対応し、あらゆる一般的な編集タスクのニーズを満たし、完全な編集データ構築チェーンと命令セット生成チェーンを構築することで、画像編集効果の精度と高品質を保証します。
ACEの発表は、AIによる画像編集分野への応用をさらに広げるだけでなく、世界中の開発者にもオープンソースサポートを提供し、阿里雲によるスマート画像処理技術分野における更なるブレークスルーを示しています。この新しいツールは、画像処理の効率と利便性を大幅に向上させ、ユーザーにより創造的で個性的な編集体験を提供します。
オープンソースアドレス:
https://github.com/ali-vilab/ACE
体験アドレス:
https://huggingface.co/spaces/scepter-studio/ACE-Chat
魔搭コミュニティ:
https://www.modelscope.cn/models/iic/ACE-0.6B-1024px