LLaVA

Assistente de linguagem e visão de grande porte, que permite bate-papo multimodais e perguntas e respostas científicas.

Produto ComumImagemMultimodalBate-papo
LLaVA é um novo modelo multimodal de grande porte treinado de ponta a ponta, combinando um codificador visual com o Vicuna, alcançando impressionantes habilidades de bate-papo, imitando o espírito do GPT-4 multimodal e obtendo a mais alta precisão em perguntas e respostas científicas. Os cenários de uso do LLaVA incluem bate-papo multimodal para aplicativos de usuários comuns e raciocínio multimodal em áreas científicas. Os dados, o código e os checkpoints do LLaVA são limitados para fins de pesquisa e seguem os termos de licença do CLIP, LLaMA, Vicuna e GPT-4.
Abrir Site

LLaVA Situação do Tráfego Mais Recente

Total de Visitas Mensais

80956

Taxa de Rejeição

52.28%

Média de Páginas por Visita

1.2

Duração Média da Visita

00:00:34

LLaVA Tendência de Visitas

LLaVA Distribuição Geográfica das Visitas

LLaVA Fontes de Tráfego

LLaVA Alternativas