PaliGemma
Modelo de lenguaje visual abierto de vanguardia de Google
Nuevo Producto PremiumImagenModelo de lenguaje visualComprensión de imágenes
PaliGemma es un modelo de lenguaje visual avanzado lanzado por Google. Combina el codificador de imágenes SigLIP y el decodificador de texto Gemma-2B, lo que le permite comprender imágenes y texto, e interpretar la interacción entre ambos mediante entrenamiento conjunto. Este modelo está diseñado para tareas específicas, como descripción de imágenes, preguntas y respuestas visuales, y segmentación, convirtiéndose en una herramienta importante para la investigación y el desarrollo.
PaliGemma Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44