Parrot
多目的強化学習フレームワーク。テキストから画像を生成します。
一般製品画像強化学習テキスト生成
Parrotは、テキストから画像を生成するために設計された、多目的強化学習フレームワークです。バッチPareto最適化により、T2I生成におけるRL最適化過程における複数の報酬間の最適なトレードオフを自動的に特定します。さらに、T2Iモデルとプロンプト拡張ネットワークの同時最適化手法を採用することで、生成品質を意識したテキストプロンプトを促進し、最終的な画像品質を向上させます。プロンプト拡張によって元のユーザープロンプトが潜在的に破棄される可能性を相殺するため、推論時に元のプロンプトを中心化ガイダンスとして導入し、生成された画像がユーザ入力に忠実であることを保証します。多数の実験とユーザ調査により、Parrotは、美学、人間の好み、画像の感情、テキストと画像の整合性など、様々な品質基準において、いくつかのベースライン手法を上回ることが示されました。
Parrot 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44