Vision Mamba

双方向状態空間モデルに基づく、効率的な視覚表現学習フレームワーク

一般製品画像コンピュータビジョン深層学習

Vision Mambaは、双方向Mambaモジュールを用いて構築された、効率的な視覚表現学習フレームワークです。計算量とメモリ制限を克服し、高解像度画像に対するTransformer形式の理解を可能にします。自己注意機構に依存せず、位置エンコーディングと双方向状態空間モデルによって視覚表現を圧縮することで、より高い性能と計算効率、メモリ効率を実現します。ImageNet分類、COCO物体検出、ADE20kセマンティックセグメンテーションタスクにおいて、DeiTなどの従来のVision Transformerを上回る性能を示し、計算効率とメモリ効率はそれぞれ2.8倍、86.8%向上しています。

Best AI Websites & Tools

Vision Mamba

Vision Mamba 最新のトラフィック状況

Vision Mamba 訪問数の傾向

Vision Mamba 訪問地理的分布

Vision Mamba トラフィックソース

Vision Mamba 代替品

diffusion-e2e-ft — 画像条件拡散モデルのファインチューニングツール

DUSt3R — カメラキャリブレーション情報不要の高密度ステレオ3D再構成

Vision Mamba — 双方向状態空間モデルに基づく、効率的な視覚表現学習フレームワーク

UniRef++ — 画像および動画オブジェクト分割のための統一モデル

HunyuanVideo-I2V — HunyuanVideo-I2Vは、テンセントがHunyuanVideoに基づいて開発した、画像から動画を生成するフレームワークです。

UniTok — UniTokは、視覚生成と理解のための統一的な視覚トークナイザーです。

VisoMaster — AI技術を活用した、自然な効果を実現する強力な動画置換・編集ソフトウェアです。

MatAnyone — MatAnyoneは、複雑な背景にも対応可能な、目標指定をサポートする安定したビデオマット化フレームワークです。

leapfusion-hunyuan-image2video — Hunyuanモデルに基づいた、高品質な動画生成を実現する革新的な画像から動画への変換技術です。

MangaNinja — MangaNinjaは、参照画像を基にした線画彩色手法で、精緻なマッチングと細やかなインタラクティブ制御を実現します。

SVFR — SVFRは、動画顔修復のための統一フレームワークです。

STAR — STARは、実世界のビデオ超解像度のための時空間エンハンスメントフレームワークであり、強力なテキストからビデオへの拡散事前学習モデルを初めて実世界のビデオ超解像度に取り込みました。

TryOffAnyone — 着用している人物から平面状の布地モデルを生成します。

StableAnimator — 高品質のアイデンティティ保持型人物アニメーション合成ツール。

LLaMA-Mesh — 3Dメッシュ生成と大規模言語モデルの統合

face_anon_simple — プライバシーを効果的に保護しながら、重要なディテールを維持する顔の匿名化技術です。

Watermark Anything — 画像に局所的な透かし情報を埋め込む画像透かし技術

Flux.1 Lite — 80億パラメーターの変分オートエンコーダーモデル。効率的なテキストから画像への生成に使用されます。

Long-LRM — 大規模シーンの高速再構築を実現する高効率3Dガウス再構築モデル

PuLID-Flux ComfyUI実装 — ComfyUIのPuLID-Flux実装

StableDelight — 鏡面反射を除去し、隠れたテクスチャを明らかにします。

カラフル拡散固有画像分解 — 野外環境下で画像を反射率と照明効果に分解する技術です。

opencv_contrib — OpenCVの追加モジュールライブラリであり、新しい画像処理機能の開発とテストに使用されます。

OpenCV (オープンソースコンピュータビジョンライブラリ) — オープンソースのコンピュータビジョンライブラリ

Open-MAGVIT2 — オープンソースの自己回帰型画像生成モデルプロジェクト

周尚辰 — コンピュータビジョンと機械学習の分野における研究とイノベーションに特化したブログサイト

AWPortrait-FL — FLUX.1-devを基にした高度な人物画像生成モデル

Show-o — 統一多モーダル理解と生成を行う単一トランスフォーマー

MixTeX-LaTeX-OCR — 高性能CPU搭載ローカルオフラインLaTeX認識ツール