首页
AI产品库
模型广场
MCP服务库
AI资讯
ZH
ZH
首页
AI产品库
AI开源&商用产品
AI产品提交
模型广场
模型库
MCP服务库
MCP服务端
MCP客户端
MCP服务调试
案例教程
AI资讯
AI热门资讯
今日AI热点
LVBench
长视频理解基准测试
优质新品
视频
视频理解
基准测试
打开网站
LVBench是一个专门设计用于长视频理解的基准测试,旨在推动多模态大型语言模型在理解数小时长视频方面的能力,这对于长期决策制定、深入电影评论和讨论、现场体育解说等实际应用至关重要。
网站截图
产品特色
需求人群
使用示例
使用教程
打开网站
LVBench 最新流量情况
月总访问量
561
跳出率
76.19%
平均页面访问数
1.0
平均访问时长
00:00:00
LVBench 访问量趋势
LVBench 访问地理位置分布
LVBench 流量来源
LVBench 替代品
LVBench
— 长视频理解基准测试
视频
•
视频理解
•
基准测试
384
ZeroBench
— ZeroBench 是一个针对当代大型多模态模型的高难度视觉基准测试。
图像
•
多模态
•
基准测试
276
Apollo-LMMs
— 大型多模态模型中视频理解的探索
视频
•
视频理解
•
多模态模型
288
MA-LMM
— 面向长期视频理解的大规模多模态模型
视频
•
视频理解
•
多模态
804
Humanity's Last Exam
— Humanity's Last Exam 是一个用于衡量大型语言模型能力的多模态基准测试。
其他
•
基准测试
•
多模态
318
mPLUG-Owl3
— 多模态大型语言模型,理解长图像序列。
图像
•
多模态
•
图像理解
312
LLaVA-Mini
— LLaVA-Mini是可高效理解图像、视频的大型多模态模型。
视频
•
图像理解、视频处理、多模态模型、高效计算、低延迟
240
mPLUG-DocOwl
— 文档理解的模块化多模态大语言模型
生产力
•
文档理解
•
多模态
420
MiniGPT4-Video
— 理解复杂视频,作诗配文的AI视频模型
视频
•
视频理解
•
视频问答
1542
M2RAG
— 用于多模态上下文中的检索增强生成的基准测试代码库。
编程
•
多模态
•
检索增强生成
318
Aria
— 多模态原生混合专家模型
编程
•
多模态
•
混合专家模型
396
MiniCPM-V 2.6
— 高性能多模态语言模型,适用于图像和视频理解。
图像
•
多模态
•
图像理解
486
VideoLLaMA3
— VideoLLaMA3是前沿的多模态基础模型,专注于图像和视频理解。
视频
•
多模态
•
视频理解
408
Ego-Exo4D
— 多模态多视角视频数据集和基准挑战
视频
•
多模态
•
多视角
570
Pixtral Large
— 前沿级多模态AI模型,提供图像和文本理解
国外精选
•
多模态
•
图像理解
366
InternVL2_5-1B
— 多模态大型语言模型,支持图像和文本理解
图像
•
多模态
•
大型语言模型
390
GenAI-Arena
— 对视觉生成模型进行基准测试
图像
•
基准测试
•
视觉生成模型
282
M2UGen
— 多模态音乐理解和生成系统
音乐
•
音乐生成
•
音乐理解
6936
MiniGemini
— 支持同时理解和生成图像的多模态大型语言模型
编程
•
多模态
•
视觉语言模型
2538
Qwen2-VL-2B
— 最先进的视觉语言模型,支持多模态理解和文本生成。
图像
•
视觉语言模型
•
多模态
462
PPLLaVA
— 视频序列理解的GPU实现模型
视频
•
视频理解
•
大型语言模型
228
Goldfish
— 视频理解的先进模型
视频
•
视频理解
•
长视频处理
360
豆包大模型
— 字节跳动自研大模型,提供多模态能力
中文精选
•
大模型
•
多模态
1458
Mini-Gemini
— 多模态AI模型,图像理解与生成兼备
生产力
•
AI模型
•
图像处理
2712
Phi-3.5-vision
— 先进的多模态模型,支持图像和文本理解。
编程
•
多模态
•
图像理解
246
PARTNR
— 多智能体任务规划与推理的基准测试
其他
•
多智能体
•
自然语言处理
234
Adept Fuyu-Heavy
— 新一代多模态模型
生产力
•
多模态模型
•
数字代理
324
DeepSeek-VL2
— 先进的多模态理解模型,融合视觉与语言能力。
图像
•
视觉语言模型
•
多模态理解
1254