SmolVLM-500M-Instruct
SmolVLM-500M 是一个轻量级多模态模型,能够处理图像和文本输入并生成文本输出。
普通产品图像多模态图像描述
SmolVLM-500M 是由 Hugging Face 开发的轻量级多模态模型,属于 SmolVLM 系列。该模型基于 Idefics3 架构,专注于高效的图像和文本处理任务。它能够接受任意顺序的图像和文本输入,生成文本输出,适用于图像描述、视觉问答等任务。其轻量级架构使其能够在资源受限的设备上运行,同时保持强大的多模态任务性能。该模型采用 Apache 2.0 许可证,支持开源和灵活的使用场景。
SmolVLM-500M-Instruct 最新流量情况
月总访问量
26103677
跳出率
43.69%
平均页面访问数
5.5
平均访问时长
00:04:43