AvatarPose

3D人体姿勢推定技術

一般製品ビデオ3D姿勢推定多視点ビデオ

AvatarPoseは、疎な多視点ビデオから、密接に相互作用する複数の人物の3D姿勢と形状を推定するための手法です。本技術は、各人のパーソナライズされた陰的ニューラルアバターを再構成し、それを事前情報として用いることで、カラーと輪郭レンダリング損失を通じて姿勢を洗練させ、密接な相互作用における3D姿勢推定の堅牢性と精度を大幅に向上させます。

Best AI Websites & Tools

AvatarPose

AvatarPose 代替品

AvatarPose — 3D人体姿勢推定技術

GVHMR — 重力視点座標を用いて世界座標系における人体運動を復元する技術

GaussianCity — 3Dガウス描画技術を使用して、高速生成を実現する効率的な境界のない3D都市生成フレームワークです。

MLGym — MLGymは、AI研究エージェントの発展を促進するための新しいフレームワークとベンチマークです。

Pippo — Pippoは、一枚の写真から高解像度で複数視点のビデオを生成する生成モデルです。

VideoWorld — VideoWorldは、ラベルなし動画から知識を学習する深層生成モデルです。

ViTPose — TransformerベースのViTPoseモデル群

TryOffAnyone — 着用している人物から平面状の布地モデルを生成します。

FlagAI — 一站式の大規模言語モデルアルゴリズム、モデル、最適化ツールを提供するオープンソースプロジェクト

video-analyzer — LlamaビジョンモデルとOpenAI Whisperを組み合わせた、ローカル環境で動画の記述を生成する動画分析ツールです。

MegaSaM — 日常の動的ビデオから、カメラパラメータと稠密な構造を迅速かつ正確に推定します。

NVIDIA Jetson Orin Nano Super Developer Kit — NVIDIAが提供する、最も経済的な生成AIスーパーコンピューター

Diffusion-Vas — 動画における非可視物体セグメンテーションとコンテンツ補完に関する最先端研究

StableAnimator — 高品質のアイデンティティ保持型人物アニメーション合成ツール。

CHOIS — 条件拡散モデルに基づく人間と物体のインタラクション合成技術

PSHuman — 一枚の写真からリアルな3D人体モデルを再構築します。

text-to-pose — テキストからポーズを生成し、さらに画像を生成するモデルです。

CAT4D — 4Dシーン作成ツール。多視点ビデオ拡散モデルを使用

DINO-X — オープンワールドに対応した検出と理解を統合したビジョンモデル

AutoSeg-SAM2 — Segment-Anything-2とSegment-Anything-1をベースとした、全動画自動セグメンテーションツール

TurboLens — 画像から瞬時にインサイトを生成する、ワンストップOCRソリューション。

LLaMA-Mesh — 3Dメッシュ生成と大規模言語モデルの統合

CountAnything — 高度なコンピュータビジョンアルゴリズムを用いて、自動的かつ正確な計数を行うアプリケーションです。

NVIDIA AI Blueprint — NVIDIA AIを活用した動画検索と要約エージェント

GenXD — あらゆる3Dおよび4Dシーンを生成するための高度なフレームワーク

Tencent-Hunyuan-Large — 業界をリードするオープンソースの大規模混合専門家モデル

Act-One — シンプルな動画入力から表現力豊かなキャラクター演技を生成します

Vmotionize — AIアニメーション生成プラットフォーム

Flex3D — 一枚の写真またはテキストプロンプトから高品質な3Dアセットを生成します。