Video-LLaVA
Modelo de aprendizado de representações visuais conjuntas por meio de projeção pré-alinhada.
Produto ComumVídeoAprendizado de MáquinaCompreensão Visual
Video-LLaVA é um modelo para aprender representações visuais conjuntas, treinado por meio de projeção pré-alinhada. Ele alinha representações de vídeo e imagem, proporcionando melhor compreensão visual. O modelo apresenta alta eficiência em aprendizado e inferência, sendo adequado para processamento de vídeo e tarefas de visão computacional.
Video-LLaVA Situação do Tráfego Mais Recente
Total de Visitas Mensais
1545596
Taxa de Rejeição
34.62%
Média de Páginas por Visita
7.0
Duração Média da Visita
00:06:23