CelebV-Text

大規模顔テキスト-ビデオデータセット

一般製品ビデオ顔テキスト

CelebV-Textは、大規模で高品質かつ多様な顔テキスト-ビデオデータセットであり、顔テキスト-ビデオ生成タスクの研究促進を目的としています。本データセットは、70,000本の野外で撮影された顔ビデオクリップを含んでおり、各クリップには20個のテキストが付属しています。これらは、40種類の一般的外観、5種類の詳細な外観、6種類の照明条件、37種類の動作、8種類感情、6種類の光線方向を網羅しています。CelebV-Textは、ビデオ、テキスト、およびテキスト-ビデオ間の関連性においてその優位性を包括的な統計分析によって検証しており、顔テキスト-ビデオ生成タスクの評価を標準化するベンチマークも構築しています。

Best AI Websites & Tools

CelebV-Text

CelebV-Text 最新のトラフィック状況

CelebV-Text 訪問数の傾向

CelebV-Text 訪問地理的分布

CelebV-Text トラフィックソース

CelebV-Text 代替品

CelebV-Text — 大規模顔テキスト-ビデオデータセット

Aria日常活動データセット — Aria日常活動データセットは、機械知覚と人工知能の発展を加速させるためのデータセットです。

EgoLife — EgoLifeは、長期的なコンテキスト理解研究を推進することを目的とした、長期、マルチモーダル、多角的な日常生活AIアシスタントプロジェクトです。

Level-Navi Agent-Search — Level-Navi Agentは、トレーニングなしで使用できるフレームワークであり、大規模言語モデルを使用して、深層クエリ理解と正確な検索を実行します。

FLORA — FLORAは、テキスト、画像、ビデオAIモデルを無限キャンバス上に統合したクリエイティブツールです。

Signs — 人工知能を活用してアメリカ手話（ASL）の学習と貢献を支援するプラットフォームです。

ZeroBench — ZeroBenchは、現代の大規模マルチモーダルモデルを対象とした、高難易度のビジュアルベンチマークです。

SWE-Lancer — SWE-Lancerは、1400以上のオープンソースソフトウェアエンジニアリングタスクを含むベンチマークで、総額100万ドル相当の価値があります。

Dolphin R1 — Dolphin R1は、推論モデルのトレーニングに使用される80万サンプルを含むデータセットです。

Procyon AI 画像生成ベンチマーク — デバイスのAIアクセラレータ推論性能を測定するためのベンチマークツールです。

Hailuo — 究極のインテリジェントなAIアシスタントソリューションです。

Nemotron-CC — Common Crawlを精緻化した、大規模言語モデルの長期事前学習用データセット

材料 — カスタム写真とビデオをビデオ拡散変換器で混合するプロジェクト。

llm-datasets — 大規模言語モデルのファインチューニングに使用する、高品質なデータセット、ツール、概念集です。

GraphAgent — エージェント型グラフ言語アシスタント

AGIBOT WORLD — 多用途ロボット戦略の発展を促進する大規模なロボット学習データセットです。

FACTS Grounding — 大規模言語モデルの事実性の評価のための最新のベンチマーク

RapBank — 初のラップ音楽生成データセット

RLVR-GSM-MATH-IF-Mixed-Constraints — 強化学習検証のための数学問題データセット

P-MMEval — 大規模言語モデル（LLM）の評価のための多言語多タスクベンチマーク

MAmmoTH-VL — 大規模マルチモーダル推論と指示調整プラットフォーム

FineWeb2 — 多言語事前学習済みデータセット

OLMo 2 1124 13B Preference Mixture — 大規模多言語選好混合データセット

ScholarQABench — 科学文献総合評価プラットフォーム

dolmino-mix-1124 — OLMo2の第2段階トレーニング用、高品質データセット。

Tülu 3 — オープンソースの先進的な言語モデルファインチューニングフレームワーク

WorkflowLLM — データ駆動型のフレームワーク。大規模言語モデルのワークフローオーケストレーション能力を強化します。

GenXD — あらゆる3Dおよび4Dシーンを生成するための高度なフレームワーク

PARTNR — マルチエージェントタスクプランニングと推論のためのベンチマーク

Sparsh — 視覚ベースの触覚センシングのための、自己教師あり触覚表現。