Modelos de Linguagem Grandes Multimodais
Fornece uma avaliação completa de MLLMs
Produto ComumProdutividadeMLLMsFerramenta de avaliação
Esta ferramenta visa avaliar a capacidade de generalização, a confiabilidade e a capacidade de raciocínio causal de MLLMs proprietários e de código aberto recentes, através de um estudo qualitativo em quatro modalidades: texto, código, imagem e vídeo, a fim de aumentar a transparência dos MLLMs. Acreditamos que essas características são alguns fatores representativos na definição da confiabilidade dos MLLMs, apoiando diversas aplicações downstream. Especificamente, avaliamos o GPT-4 e o Gemini (modelos fechados) e seis MLLMs e LLMs de código aberto. No total, avaliamos 230 casos projetados manualmente, com os resultados qualitativos resumidos em 12 pontuações (ou seja, 4 modalidades multiplicadas por 3 atributos). No total, revelamos 14 descobertas empíricas que ajudam a entender as capacidades e limitações dos MLLMs proprietários e de código aberto, para um suporte mais confiável de aplicações downstream multimodais.
Modelos de Linguagem Grandes Multimodais Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44