ODINモデル

単一モデルで2Dおよび3Dの知覚を実現

一般製品画像コンピュータビジョンインスタンスセグメンテーション

ODIN（Omni-Dimensional INstance segmentation）は、トランスフォーマーアーキテクチャを用いて、2D RGB画像と3D点群のセグメンテーションとラベリングを行うモデルです。2Dビューと3Dビュー間で情報を交互に融合させることで、2Dと3Dの特徴操作を区別します。ODINは、ScanNet200、Matterport3D、AI2THOR 3Dインスタンスセグメンテーションベンチマークにおいて最先端の性能を達成し、ScanNet、S3DIS、COCOにおいても競争力のある性能を示しています。知覚された3D点群の代わりに3Dメッシュからサンプリングされた点群を使用した場合、従来の手法をすべて上回ります。具体化エージェントアーキテクチャにおける3D知覚エンジンとして活用することで、TEACh対話行動ベンチマークにおいて新たな最先端レベルを達成しました。コードとチェックポイントはプロジェクトウェブサイトでご確認いただけます。

Best AI Websites & Tools

ODINモデル

ODINモデル 最新のトラフィック状況

ODINモデル 訪問数の傾向

ODINモデル 訪問地理的分布

ODINモデル トラフィックソース

ODINモデル 代替品

ODINモデル — 単一モデルで2Dおよび3Dの知覚を実現

YOLOv8 — YOLOv8物体検出追跡モデル

GaussianCity — 3Dガウス描画技術を使用して、高速生成を実現する効率的な境界のない3D都市生成フレームワークです。

MLGym — MLGymは、AI研究エージェントの発展を促進するための新しいフレームワークとベンチマークです。

Pippo — Pippoは、一枚の写真から高解像度で複数視点のビデオを生成する生成モデルです。

VideoWorld — VideoWorldは、ラベルなし動画から知識を学習する深層生成モデルです。

ViTPose — TransformerベースのViTPoseモデル群

TryOffAnyone — 着用している人物から平面状の布地モデルを生成します。

FlagAI — 一站式の大規模言語モデルアルゴリズム、モデル、最適化ツールを提供するオープンソースプロジェクト

video-analyzer — LlamaビジョンモデルとOpenAI Whisperを組み合わせた、ローカル環境で動画の記述を生成する動画分析ツールです。

MegaSaM — 日常の動的ビデオから、カメラパラメータと稠密な構造を迅速かつ正確に推定します。

NVIDIA Jetson Orin Nano Super Developer Kit — NVIDIAが提供する、最も経済的な生成AIスーパーコンピューター

Diffusion-Vas — 動画における非可視物体セグメンテーションとコンテンツ補完に関する最先端研究

StableAnimator — 高品質のアイデンティティ保持型人物アニメーション合成ツール。

CHOIS — 条件拡散モデルに基づく人間と物体のインタラクション合成技術

PSHuman — 一枚の写真からリアルな3D人体モデルを再構築します。

text-to-pose — テキストからポーズを生成し、さらに画像を生成するモデルです。

DINO-X — オープンワールドに対応した検出と理解を統合したビジョンモデル

AutoSeg-SAM2 — Segment-Anything-2とSegment-Anything-1をベースとした、全動画自動セグメンテーションツール

TurboLens — 画像から瞬時にインサイトを生成する、ワンストップOCRソリューション。

LLaMA-Mesh — 3Dメッシュ生成と大規模言語モデルの統合

CountAnything — 高度なコンピュータビジョンアルゴリズムを用いて、自動的かつ正確な計数を行うアプリケーションです。

NVIDIA AI Blueprint — NVIDIA AIを活用した動画検索と要約エージェント

GenXD — あらゆる3Dおよび4Dシーンを生成するための高度なフレームワーク

Tencent-Hunyuan-Large — 業界をリードするオープンソースの大規模混合専門家モデル

Aya Expanse-8b — 23言語に対応した大規模言語モデル

Janus-1.3B — 多様なモダリティの理解と生成を統合したモデル

Janus — 次世代自己回帰フレームワーク。マルチモーダル理解と生成を統合

Flex3D — 一枚の写真またはテキストプロンプトから高品質な3Dアセットを生成します。

ODINモデル最新のトラフィック状況

ODINモデル訪問数の傾向

ODINモデル訪問地理的分布

ODINモデルトラフィックソース

ODINモデル代替品