SmolVLM-500M-Instruct

SmolVLM-500M 是一个轻量级多模态模型,能够处理图像和文本输入并生成文本输出。

普通产品图像多模态图像描述
SmolVLM-500M 是由 Hugging Face 开发的轻量级多模态模型,属于 SmolVLM 系列。该模型基于 Idefics3 架构,专注于高效的图像和文本处理任务。它能够接受任意顺序的图像和文本输入,生成文本输出,适用于图像描述、视觉问答等任务。其轻量级架构使其能够在资源受限的设备上运行,同时保持强大的多模态任务性能。该模型采用 Apache 2.0 许可证,支持开源和灵活的使用场景。
打开网站

SmolVLM-500M-Instruct 最新流量情况

月总访问量

26103677

跳出率

43.69%

平均页面访问数

5.5

平均访问时长

00:04:43

SmolVLM-500M-Instruct 访问量趋势

SmolVLM-500M-Instruct 访问地理位置分布

SmolVLM-500M-Instruct 流量来源

SmolVLM-500M-Instruct 替代品