jina-clip-v2

多语言多模态嵌入模型,用于文本和图像检索。

普通产品生产力多模态多语言
jina-clip-v2是由Jina AI开发的多语言多模态嵌入模型,支持89种语言的图像检索,能够处理512x512分辨率的图像,提供从64到1024不同维度的输出,以适应不同的存储和处理需求。该模型结合了强大的文本编码器Jina-XLM-RoBERTa和视觉编码器EVA02-L14,通过联合训练创建了对齐的图像和文本表示。jina-clip-v2在多模态搜索和检索方面提供了更准确、更易用的能力,特别是在打破语言障碍、提供跨模态理解和检索方面表现出色。
打开网站

jina-clip-v2 最新流量情况

月总访问量

19075321

跳出率

45.07%

平均页面访问数

5.5

平均访问时长

00:05:32

jina-clip-v2 访问量趋势

jina-clip-v2 访问地理位置分布

jina-clip-v2 流量来源

jina-clip-v2 替代品