LLaVA
Assistente de linguagem e visão de grande porte, que permite bate-papo multimodais e perguntas e respostas científicas.
Produto ComumImagemMultimodalBate-papo
LLaVA é um novo modelo multimodal de grande porte treinado de ponta a ponta, combinando um codificador visual com o Vicuna, alcançando impressionantes habilidades de bate-papo, imitando o espírito do GPT-4 multimodal e obtendo a mais alta precisão em perguntas e respostas científicas. Os cenários de uso do LLaVA incluem bate-papo multimodal para aplicativos de usuários comuns e raciocínio multimodal em áreas científicas. Os dados, o código e os checkpoints do LLaVA são limitados para fins de pesquisa e seguem os termos de licença do CLIP, LLaMA, Vicuna e GPT-4.
LLaVA Situação do Tráfego Mais Recente
Total de Visitas Mensais
80956
Taxa de Rejeição
52.28%
Média de Páginas por Visita
1.2
Duração Média da Visita
00:00:34