llama3v

基于llama3 8B的SOTA视觉模型

普通产品图像视觉模型多模态学习
llama3v是一个基于Llama3 8B和siglip-so400m的SOTA(State of the Art,即最先进技术)视觉模型。它是一个开源的VLLM(视觉语言多模态学习模型),在Huggingface上提供模型权重,支持快速本地推理,并发布了推理代码。该模型结合了图像识别和文本生成,通过添加投影层将图像特征映射到LLaMA嵌入空间,以提高模型对图像的理解能力。
打开网站

llama3v 最新流量情况

月总访问量

488643166

跳出率

37.28%

平均页面访问数

5.7

平均访问时长

00:06:37

llama3v 访问量趋势

llama3v 访问地理位置分布

llama3v 流量来源

llama3v 替代品