AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

AIマネタイズガイド

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

LVBench

長尺動画理解ベンチマーク

プレミアム新製品ビデオ動画理解ベンチマーク

ウェブサイトを開く

LVBenchは、数時間の長尺動画の理解能力において、マルチモーダル大規模言語モデルの能力向上を目的とした、長尺動画理解のための専用ベンチマークです。これは、長期的な意思決定、詳細な映画評論や議論、現場のスポーツ実況解説など、現実世界の様々な応用において極めて重要です。

ウェブサイトを開く

LVBench 最新のトラフィック状況

月間総訪問数

561

直帰率

57.00%

平均ページ/訪問

2.0

平均訪問時間

00:00:05

LVBench 訪問数の傾向

LVBench 訪問地理的分布

LVBench トラフィックソース

LVBench 代替品

SWE-Lancer — SWE-Lancerは、1400以上のオープンソースソフトウェアエンジニアリングタスクを含むベンチマークで、総額100万ドル相当の価値があります。

国際セレクション

•ベンチマーク•ソフトウェアエンジニアリング

180

Qwen2.5-VL — Qwen2.5-VLは、画像や動画の内容を理解し、それに対応するテキストを生成できる強力なビジョン言語モデルです。

中国セレクション

•マルチモーダル•画像認識

1068

Tarsier — Tarsierは、バイトダンスが開発した、高品質なビデオ説明を生成するための、大規模なビデオ言語モデルです。

ビデオ

•動画説明•動画理解

678

VideoLLaMA3 — VideoLLaMA3は、画像と動画の理解に特化した最先端のマルチモーダル基盤モデルです。

ビデオ

•マルチモーダル•動画理解

204

Mobile-Agent-E — 複雑なタスク向けに設計された、自己進化型モバイルアシスタントです。

生産性

•人工知能•モバイルアシスタント

330

OmAgent.com — スマートデバイスなど向けのマルチモーダルネイティブエージェントフレームワークです。

生産性

•マルチモーダル•スマートデバイス

174

Procyon AI 画像生成ベンチマーク — デバイスのAIアクセラレータ推論性能を測定するためのベンチマークツールです。

その他

•画像生成•ベンチマーク

384

videoprompt.org — AI動画生成プロンプトライブラリ

ビデオ

•AI動画生成•動画編集

342

FlagEval — モデル評価プラットフォーム

その他

•モデル評価•人工知能

186

FACTS Grounding — 大規模言語モデルの事実性の評価のための最新のベンチマーク

その他

•言語モデル•ベンチマーク

198

OmniAudio-2.6B — 世界最速のエッジデバイス対応音声言語モデル

生産性

•音声処理•エッジコンピューティング

252

P-MMEval — 大規模言語モデル（LLM）の評価のための多言語多タスクベンチマーク

その他

•多言語•ベンチマーク

132

Qwen2-VL-7B — Qwen2-VL-7Bは最新のビジョン言語モデルであり、マルチモーダル理解とテキスト生成をサポートします。

画像

•ビジョン言語モデル•マルチモーダル

222

ultravox-v0_4_1-mistral-nemo — マルチモーダル音声大規模言語モデル

生産性

•音声認識•音声翻訳

258

ultravox-v0_4_1-llama-3_1-8b — マルチモーダル音声大型言語モデル

生産性

•音声認識•音声翻訳

168

TableGPT2 — 大規模マルチモーダルモデルで、表データと統合されています。

生産性

•マルチモーダルモデル•表データ

702

PPLLaVA — GPU実装による動画シーケンス理解モデル

ビデオ

•動画理解•大規模言語モデル

192

PARTNR — マルチエージェントタスクプランニングと推論のためのベンチマーク

その他

•マルチエージェント•自然言語処理

150

LongVU — 長尺動画言語理解のための時空間適応圧縮モデル

ビデオ

•動画理解•時空間圧縮

258

LLMベンチマークにおける不正行為の研究 — 自動言語モデルのベンチマークにおける不正行為を調査する研究プロジェクトです。

プログラミング

•自然言語処理•機械学習

150

Video-CCAM — テンセントQQマルチメディア研究チームが開発した、軽量で柔軟な動画多言語モデル

ビデオ

•動画理解•多言語モデル

240

タートルベンチマーク — 大規模言語モデルの論理的推論能力とコンテキスト理解能力を評価します。

プログラミング

•ベンチマーク•論理的推論

180

llm-colosseum — ストリートファイター3対戦による大規模言語モデルの評価

プログラミング

•人工知能•ベンチマーク

216

Goldfish — 動画理解のための最先端モデル

ビデオ

•動画理解•長尺動画処理

360

ShareGPT4Video — 動画の理解と生成を向上させるAIモデルです。

ビデオ

•動画理解•テキストから動画

756

AIニュース

AIデイリー

AIタイムライン

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

LVBench

LVBench 最新のトラフィック状況

LVBench 訪問数の傾向

LVBench 訪問地理的分布

LVBench トラフィックソース

LVBench 代替品

LVBench — 長尺動画理解ベンチマーク

Apollo-LMMs — 大規模マルチモーダルモデルにおける動画理解の探求

MiniGPT4-Video — 複雑な動画を理解し、詩を添えて説明するAIビデオモデル

TableGPT-agent — TableGPT2をベースとした、表データに基づく質疑応答タスクのための事前構築済みエージェントです。

ZeroBench — ZeroBenchは、現代の大規模マルチモーダルモデルを対象とした、高難易度のビジュアルベンチマークです。

SWE-Lancer — SWE-Lancerは、1400以上のオープンソースソフトウェアエンジニアリングタスクを含むベンチマークで、総額100万ドル相当の価値があります。

Qwen2.5-VL — Qwen2.5-VLは、画像や動画の内容を理解し、それに対応するテキストを生成できる強力なビジョン言語モデルです。

Tarsier — Tarsierは、バイトダンスが開発した、高品質なビデオ説明を生成するための、大規模なビデオ言語モデルです。

VideoLLaMA3 — VideoLLaMA3は、画像と動画の理解に特化した最先端のマルチモーダル基盤モデルです。

Mobile-Agent-E — 複雑なタスク向けに設計された、自己進化型モバイルアシスタントです。

OmAgent.com — スマートデバイスなど向けのマルチモーダルネイティブエージェントフレームワークです。

Procyon AI 画像生成ベンチマーク — デバイスのAIアクセラレータ推論性能を測定するためのベンチマークツールです。

videoprompt.org — AI動画生成プロンプトライブラリ

FlagEval — モデル評価プラットフォーム

FACTS Grounding — 大規模言語モデルの事実性の評価のための最新のベンチマーク

OmniAudio-2.6B — 世界最速のエッジデバイス対応音声言語モデル

P-MMEval — 大規模言語モデル（LLM）の評価のための多言語多タスクベンチマーク

Qwen2-VL-7B — Qwen2-VL-7Bは最新のビジョン言語モデルであり、マルチモーダル理解とテキスト生成をサポートします。

ultravox-v0_4_1-mistral-nemo — マルチモーダル音声大規模言語モデル

ultravox-v0_4_1-llama-3_1-8b — マルチモーダル音声大型言語モデル

TableGPT2 — 大規模マルチモーダルモデルで、表データと統合されています。

PPLLaVA — GPU実装による動画シーケンス理解モデル

PARTNR — マルチエージェントタスクプランニングと推論のためのベンチマーク

LongVU — 長尺動画言語理解のための時空間適応圧縮モデル

LLMベンチマークにおける不正行為の研究 — 自動言語モデルのベンチマークにおける不正行為を調査する研究プロジェクトです。

Video-CCAM — テンセントQQマルチメディア研究チームが開発した、軽量で柔軟な動画多言語モデル

タートルベンチマーク — 大規模言語モデルの論理的推論能力とコンテキスト理解能力を評価します。

llm-colosseum — ストリートファイター3対戦による大規模言語モデルの評価

Goldfish — 動画理解のための最先端モデル

ShareGPT4Video — 動画の理解と生成を向上させるAIモデルです。