LLaVA
Asistente de lenguaje y visión a gran escala, que permite el chat multimodal y la respuesta a preguntas científicas.
Producto ComúnImagenMultimodalChat
LLaVA es un nuevo modelo multimodal a gran escala entrenado de extremo a extremo, que combina un codificador visual con Vicuña, logrando una impresionante capacidad de chat, emulando el espíritu del GPT-4 multimodal y alcanzando una nueva precisión máxima en las respuestas a preguntas científicas. Los casos de uso de LLaVA incluyen el chat multimodal para aplicaciones de usuarios cotidianos y el razonamiento multimodal en el ámbito científico. Los datos, el código y los puntos de control de LLaVA están limitados a fines de investigación y se rigen por las licencias de CLIP, LLaMA, Vicuña y GPT-4.
LLaVA Situación del tráfico más reciente
Total de visitas mensuales
80956
Tasa de rebote
52.28%
Páginas promedio por visita
1.2
Duración promedio de la visita
00:00:34