MiniGPT4-Vídeo

Modelo de IA para vídeo que compreende vídeos complexos e compõe poemas e legendas.

Produto ComumVídeoCompreensão de vídeoPerguntas e respostas sobre vídeo
MiniGPT4-Vídeo é um modelo multimodal de grande escala projetado para compreensão de vídeo, capaz de processar dados visuais temporais e dados textuais, gerando títulos, slogans e respondendo a perguntas sobre vídeos. Baseado no MiniGPT-v2 e combinando o backbone visual EVA-CLIP, foi treinado em múltiplas etapas, incluindo pré-treinamento em larga escala vídeo-texto e ajuste fino para responder a perguntas sobre vídeos. Apresentou melhorias significativas nos benchmarks MSVD, MSRVTT, TGIF e TVQA. Preço desconhecido.
Abrir Site

MiniGPT4-Vídeo Situação do Tráfego Mais Recente

Total de Visitas Mensais

1900

Taxa de Rejeição

58.75%

Média de Páginas por Visita

1.3

Duração Média da Visita

00:00:01

MiniGPT4-Vídeo Tendência de Visitas

MiniGPT4-Vídeo Distribuição Geográfica das Visitas

MiniGPT4-Vídeo Fontes de Tráfego

MiniGPT4-Vídeo Alternativas