PALP
テキストから画像へのモデルをパーソナライズする手法
一般製品画像テキストから画像パーソナライズ
コンテンツ制作者は、従来のテキストから画像へのモデルの能力を超えて、独自のテーマを用いたパーソナライズされた画像を作成したいと考えています。また、生成される画像に特定の場所、スタイル、雰囲気などを含めたい場合もあります。既存のパーソナライズ手法では、パーソナライズ能力と複雑なテキストプロンプトとの整合性の間にトレードオフが生じる可能性があります。このトレードオフは、ユーザーのプロンプトとテーマの忠実性に支障をきたす可能性があります。本研究では、この問題に対処するため、単一のプロンプトに焦点を当てたパーソナライズ手法を提案します。この手法をプロンプト整合パーソナライズと呼びます。この手法は限定的に見えるかもしれませんが、テキストの整合性の向上において優れた性能を示し、複雑で高度なプロンプトを用いた画像を作成できます。これは、現在の技術では困難な課題です。具体的には、追加のスコア蒸留サンプリング項を用いて、パーソナライズモデルとターゲットプロンプトの整合性を保ちます。多様な撮影設定と単一撮影設定における手法の汎用性を示し、複数のテーマの組み合わせや、美術作品などの参照画像からのインスピレーションの取得も可能です。既存のベースラインと最先端技術との定量的および定性的比較も行っています。
PALP 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44