GenSAM

迷彩目標分割のための汎用テキストプロンプト手法です。

一般製品画像画像処理画像生成
GenSAMは、クロスモーダル思考連鎖プロンプティング(CCTP)技術を用いて視覚プロンプトを理解し、汎用テキストプロンプトを活用して信頼性の高い視覚プロンプトを取得する、迷彩オブジェクト検出(COD)手法です。漸進的マスク生成(PMG)により、テスト時に視覚プロンプトを自動生成・最適化し、追加の学習なしで、効率的で正確な迷彩目標分割を実現します。
ウェブサイトを開く

GenSAM 代替品