LLaVA

Asistente de lenguaje y visión a gran escala, que permite el chat multimodal y la respuesta a preguntas científicas.

Producto ComúnImagenMultimodalChat
LLaVA es un nuevo modelo multimodal a gran escala entrenado de extremo a extremo, que combina un codificador visual con Vicuña, logrando una impresionante capacidad de chat, emulando el espíritu del GPT-4 multimodal y alcanzando una nueva precisión máxima en las respuestas a preguntas científicas. Los casos de uso de LLaVA incluyen el chat multimodal para aplicaciones de usuarios cotidianos y el razonamiento multimodal en el ámbito científico. Los datos, el código y los puntos de control de LLaVA están limitados a fines de investigación y se rigen por las licencias de CLIP, LLaMA, Vicuña y GPT-4.
Abrir sitio web

LLaVA Situación del tráfico más reciente

Total de visitas mensuales

80956

Tasa de rebote

52.28%

Páginas promedio por visita

1.2

Duración promedio de la visita

00:00:34

LLaVA Tendencia de visitas

LLaVA Distribución geográfica de las visitas

LLaVA Fuentes de tráfico

LLaVA Alternativas