MiniGPT4-Vídeo
Modelo de IA para vídeo que compreende vídeos complexos e compõe poemas e legendas.
Produto ComumVídeoCompreensão de vídeoPerguntas e respostas sobre vídeo
MiniGPT4-Vídeo é um modelo multimodal de grande escala projetado para compreensão de vídeo, capaz de processar dados visuais temporais e dados textuais, gerando títulos, slogans e respondendo a perguntas sobre vídeos. Baseado no MiniGPT-v2 e combinando o backbone visual EVA-CLIP, foi treinado em múltiplas etapas, incluindo pré-treinamento em larga escala vídeo-texto e ajuste fino para responder a perguntas sobre vídeos. Apresentou melhorias significativas nos benchmarks MSVD, MSRVTT, TGIF e TVQA. Preço desconhecido.
MiniGPT4-Vídeo Situação do Tráfego Mais Recente
Total de Visitas Mensais
1900
Taxa de Rejeição
58.75%
Média de Páginas por Visita
1.3
Duração Média da Visita
00:00:01