jina-clip-v2

Modelo de incrustaciones multimodales y multilingües para la recuperación de texto e imágenes.

Producto ComúnProductividadMultimodalMultilingüe
jina-clip-v2 es un modelo de incrustaciones multimodales y multilingües desarrollado por Jina AI, que admite la recuperación de imágenes en 89 idiomas, puede procesar imágenes con una resolución de 512x512 píxeles y ofrece salidas de diferentes dimensiones, desde 64 hasta 1024, para adaptarse a las diversas necesidades de almacenamiento y procesamiento. El modelo combina el potente codificador de texto Jina-XLM-RoBERTa y el codificador visual EVA02-L14, creando mediante entrenamiento conjunto representaciones alineadas de imágenes y texto. jina-clip-v2 ofrece una capacidad más precisa y fácil de usar en la búsqueda y recuperación multimodales, especialmente en la superación de las barreras lingüísticas y en la comprensión y recuperación multimodales.
Abrir sitio web

jina-clip-v2 Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

jina-clip-v2 Tendencia de visitas

jina-clip-v2 Distribución geográfica de las visitas

jina-clip-v2 Fuentes de tráfico

jina-clip-v2 Alternativas