MiniGPT4-Video
理解复杂视频,作诗配文的AI视频模型
普通产品视频视频理解视频问答
MiniGPT4-Video是为视频理解设计的多模态大模型,能处理时态视觉数据和文本数据,配标题、宣传语,适用于视频问答。基于MiniGPT-v2,结合视觉主干EVA-CLIP,训练多阶段阶段,包括大规模视频-文本预训练和视频问题解答微调。在MSVD、MSRVTT、TGIF和TVQA基准上取得显著提升。定价未知。
MiniGPT4-Video 最新流量情况
月总访问量
2397
跳出率
35.21%
平均页面访问数
1.6
平均访问时长
00:02:11