Best AI Websites & Tools
ja
AI製品ランキング
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
ホーム
AIニュース
AIデイリー
マネタイズガイド
AIチュートリアル
AIツールナビ
AI製品ライブラリ
ja
AI製品ランキング
AvatarPose
3D人体姿勢推定技術
一般製品
ビデオ
3D姿勢推定
多視点ビデオ
ウェブサイトを開く
AvatarPoseは、疎な多視点ビデオから、密接に相互作用する複数の人物の3D姿勢と形状を推定するための手法です。本技術は、各人のパーソナライズされた陰的ニューラルアバターを再構成し、それを事前情報として用いることで、カラーと輪郭レンダリング損失を通じて姿勢を洗練させ、密接な相互作用における3D姿勢推定の堅牢性と精度を大幅に向上させます。
ウェブサイトスクリーンショット
製品の特徴
対象者
使用例
使用チュートリアル
ソーシャルネットワーク
ウェブサイトを開く
パーソナライズされた陰的ニューラルアバターを事前情報として利用することで、姿勢推定の堅牢性と精度を高めます。
階層的ボリュームレンダリング技術を用いて、多視点ビデオから効率的にアバターを再構成します。
RGBと輪郭レンダリング損失を組み合わせることで、3D姿勢最適化を強化します。
衝突損失を導入することで、キャラクタ間の貫通を回避します。
アバター学習と姿勢最適化を交互に行うことで、完全で正確な3D人体姿勢を得ます。
複数の公開データセットにおいて、最先端の性能を示しました。
対象ユーザーは、コンピュータビジョン分野の研究者や開発者、特に3D人体姿勢推定とモーションキャプチャ技術に携わる方々です。本技術は、より正確な人体動作の捕捉と分析を支援し、仮想現実、拡張現実、アニメーション制作、動作分析などの分野に適用可能です。
仮想現実環境におけるリアルな人体動作のシミュレーション。
アニメーション映画におけるキャラクタ動作の正確な捕捉と再現。
スポーツトレーニングにおける選手の動作分析によるパフォーマンス向上。
1. 疎な多視点ビデオ入力の準備をします。
2. AvatarPoseモデルを用いてビデオ内の個体についてパーソナライズされたアバターを再構成します。
3. 再構成されたアバターを事前情報として用い、カラーと輪郭レンダリング損失を通じて姿勢を最適化します。
4. 衝突損失を導入して、キャラクタ間の貫通問題に対処します。
5. アバター学習と姿勢最適化を交互に行い、満足のいく3D姿勢推定結果が得られるまで繰り返します。
indiepa
bento
patreon
linktree
ウェブサイトを開く
AvatarPose 代替品
AvatarPose
— 3D人体姿勢推定技術
ビデオ
•
3D姿勢推定
•
多視点ビデオ
306
GVHMR
— 重力視点座標を用いて世界座標系における人体運動を復元する技術
画像
•
人体運動復元
•
コンピュータビジョン
234
GaussianCity
— 3Dガウス描画技術を使用して、高速生成を実現する効率的な境界のない3D都市生成フレームワークです。
画像
•
3D生成
•
ガウス描画
24
MLGym
— MLGymは、AI研究エージェントの発展を促進するための新しいフレームワークとベンチマークです。
プログラミング
•
AI研究
•
強化学習
54
Pippo
— Pippoは、一枚の写真から高解像度で複数視点のビデオを生成する生成モデルです。
画像
•
画像生成
•
複数視点ビデオ
516
VideoWorld
— VideoWorldは、ラベルなし動画から知識を学習する深層生成モデルです。
ビデオ
•
人工知能
•
コンピュータビジョン
276
ViTPose
— TransformerベースのViTPoseモデル群
画像
•
人工知能
•
コンピュータビジョン
90
TryOffAnyone
— 着用している人物から平面状の布地モデルを生成します。
画像
•
深層学習
•
画像生成
648
FlagAI
— 一站式の大規模言語モデルアルゴリズム、モデル、最適化ツールを提供するオープンソースプロジェクト
プログラミング
•
人工知能
•
大規模言語モデル
126
video-analyzer
— LlamaビジョンモデルとOpenAI Whisperを組み合わせた、ローカル環境で動画の記述を生成する動画分析ツールです。
ビデオ
•
動画分析
•
コンピュータビジョン
1230
MegaSaM
— 日常の動的ビデオから、カメラパラメータと稠密な構造を迅速かつ正確に推定します。
画像
•
Structure from Motion
•
単眼SLAM
126
NVIDIA Jetson Orin Nano Super Developer Kit
— NVIDIAが提供する、最も経済的な生成AIスーパーコンピューター
生産性
•
NVIDIA Jetson
•
生成AI
138
Diffusion-Vas
— 動画における非可視物体セグメンテーションとコンテンツ補完に関する最先端研究
ビデオ
•
動画セグメンテーション
•
非可視物体
54
StableAnimator
— 高品質のアイデンティティ保持型人物アニメーション合成ツール。
ビデオ
•
動画合成
•
人物アニメーション
486
CHOIS
— 条件拡散モデルに基づく人間と物体のインタラクション合成技術
生産性
•
人工知能
•
コンピュータビジョン
90
PSHuman
— 一枚の写真からリアルな3D人体モデルを再構築します。
画像
•
3D再構築
•
人体モデル
606
text-to-pose
— テキストからポーズを生成し、さらに画像を生成するモデルです。
画像
•
テキストから画像
•
ポーズ推定
102
CAT4D
— 4Dシーン作成ツール。多視点ビデオ拡散モデルを使用
画像
•
4Dシーン
•
多視点ビデオ
186
DINO-X
— オープンワールドに対応した検出と理解を統合したビジョンモデル
中国セレクション
•
コンピュータビジョン
•
物体検出
444
AutoSeg-SAM2
— Segment-Anything-2とSegment-Anything-1をベースとした、全動画自動セグメンテーションツール
画像
•
動画セグメンテーション
•
オブジェクト追跡
108
TurboLens
— 画像から瞬時にインサイトを生成する、ワンストップOCRソリューション。
生産性
•
OCR
•
コンピュータビジョン
198
LLaMA-Mesh
— 3Dメッシュ生成と大規模言語モデルの統合
生産性
•
3Dモデリング
•
人工知能
270
CountAnything
— 高度なコンピュータビジョンアルゴリズムを用いて、自動的かつ正確な計数を行うアプリケーションです。
画像
•
コンピュータビジョン
•
物体計数
216
NVIDIA AI Blueprint
— NVIDIA AIを活用した動画検索と要約エージェント
ビデオ
•
コンピュータビジョン
•
動画分析
198
GenXD
— あらゆる3Dおよび4Dシーンを生成するための高度なフレームワーク
画像
•
3D生成
•
4D生成
156
Tencent-Hunyuan-Large
— 業界をリードするオープンソースの大規模混合専門家モデル
生産性
•
人工知能
•
自然言語処理
336
Act-One
— シンプルな動画入力から表現力豊かなキャラクター演技を生成します
ビデオ
•
人工知能
•
機械学習
900
Vmotionize
— AIアニメーション生成プラットフォーム
デザイン
•
AIアニメーション
•
3Dアニメーション
330
Flex3D
— 一枚の写真またはテキストプロンプトから高品質な3Dアセットを生成します。
画像
•
3D再構築
•
コンピュータビジョン
354