GLIGEN
プロンプトベースのオープンソース画像生成モデル
一般製品画像コンピュータビジョン深層学習
GLIGENは、テキストプロンプトに基づいたオープンソースの画像生成モデルです。テキスト記述やバウンディングボックスなどの制約条件に基づいて画像を生成できます。このモデルは、事前学習済みのテキストから画像への拡散モデルのパラメータを固定し、そこに新しいデータを追加することで実現されています。このモジュール式設計により、効率的なトレーニングと高い推論柔軟性が得られます。GLIGENは、オープンワールドにおける条件付き画像生成をサポートし、新しく出現する概念やレイアウトに対しても高い汎化能力を備えています。
GLIGEN 最新のトラフィック状況
月間総訪問数
422
直帰率
69.70%
平均ページ/訪問
1.0
平均訪問時間
00:00:00