jina-clip-v2
Modelo de incorporação multimodal multilíngue para recuperação de texto e imagem.
Produto ComumProdutividadeMultimodalMultilíngue
O jina-clip-v2 é um modelo de incorporação multimodal multilíngue desenvolvido pela Jina AI, suportando recuperação de imagens em 89 idiomas, capaz de processar imagens com resolução de 512x512 e oferecendo saídas com dimensões de 64 a 1024 para atender às diferentes necessidades de armazenamento e processamento. O modelo combina o poderoso codificador de texto Jina-XLM-RoBERTa e o codificador visual EVA02-L14, criando, através de treinamento conjunto, representações alinhadas de imagem e texto. O jina-clip-v2 oferece capacidades mais precisas e fáceis de usar em busca e recuperação multimodais, destacando-se em quebrar barreiras linguísticas e fornecer compreensão e recuperação multimodal.
jina-clip-v2 Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44