SlowFast-LLaVA
Modelo de linguagem grande sem treinamento para compreensão e raciocínio de vídeo.
Produto ComumProdutividadePerguntas e Respostas em VídeoAprendizado Multimodal
SlowFast-LLaVA é um modelo de linguagem grande multimodal sem treinamento, projetado para compreensão e raciocínio de vídeo. Sem necessidade de ajuste fino em quaisquer dados, ele atinge desempenho comparável ou superior ao de modelos de linguagem grandes de vídeo de última geração em diversas tarefas e benchmarks de perguntas e respostas em vídeo.
SlowFast-LLaVA Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34