Llama-3.2-90B-Vision
Modelo de lenguaje grande multimodal, optimizado para el reconocimiento visual y el razonamiento de imágenes.
Nuevo Producto PremiumProductividadIAAprendizaje automático
Llama-3.2-90B-Vision es un modelo de lenguaje grande multimodal (LLM) lanzado por Meta, que se centra en el reconocimiento visual, el razonamiento de imágenes, la descripción de imágenes y la respuesta a preguntas generales sobre imágenes. Este modelo supera a muchos modelos multimodales existentes, tanto de código abierto como cerrados, en pruebas de referencia comunes del sector.
Llama-3.2-90B-Vision Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44