PaliGemma

Google的尖端开放视觉语言模型

优质新品图像视觉语言模型图像理解
PaliGemma是Google发布的一款先进的视觉语言模型,它结合了图像编码器SigLIP和文本解码器Gemma-2B,能够理解图像和文本,并通过联合训练实现图像和文本的交互理解。该模型专为特定的下游任务设计,如图像描述、视觉问答、分割等,是研究和开发领域的重要工具。
打开网站

PaliGemma 最新流量情况

月总访问量

17104189

跳出率

44.67%

平均页面访问数

5.5

平均访问时长

00:05:49

PaliGemma 访问量趋势

PaliGemma 访问地理位置分布

PaliGemma 流量来源

PaliGemma 替代品