LLaVA-3b

LLaVA-3b是一种基于Dolphin 2.6 Phi进行微调的模型，使用SigLIP 400M的视觉塔以LLaVA方式进行微调。模型具有多个图像标记、使用视觉编码器的最新层输出等特点。

普通产品编程Hugging FaceLLaVA-3b

LLaVA-3b是一种基于Dolphin 2.6 Phi进行微调的模型，使用SigLIP 400M的视觉塔以LLaVA方式进行微调。模型具有多个图像标记、使用视觉编码器的最新层输出等特点。此模型基于Phi-2，受微软研究许可证约束，禁止商业使用。感谢ML Collective提供的计算资源积分。

模型微调
模型部署
在Transformers中使用

LLaVA-3b可用于图像描述生成、视觉问答等应用场景。

打开网站

LLaVA-3b 最新流量情况

月总访问量

26103677

跳出率

43.69%

平均页面访问数

5.5

平均访问时长

00:04:43

LLaVA-3b 访问量趋势

LLaVA-3b 访问地理位置分布

LLaVA-3b 流量来源

LLaVA-3b 替代品

Best AI Websites & Tools

LLaVA-3b

LLaVA-3b 最新流量情况

LLaVA-3b 访问量趋势

LLaVA-3b 访问地理位置分布

LLaVA-3b 流量来源

LLaVA-3b 替代品

FastApply-7B-v1.0 — 一个用于即时代码应用的7B模型，专为快速、准确的代码编辑任务设计。

RAG-FiT — RAG-FiT是一个用于提升LLMs利用外部信息能力的库，通过特别创建的RAG增强数据集对模型进行微调。

PaliGemma2-3b-pt-448 — PaliGemma 2是一个强大的视觉-语言模型，支持多种视觉语言任务。

Bakery — 一个开源AI模型微调与变现平台，助力AI初创企业、机器学习工程师和研究人员。

Llama-3.1-70B-Instruct-AWQ-INT4 — 70B参数的文本生成模型

Bespoke Labs — 数据定制化服务，助力模型精准微调

Llama-Lynx-70b-4bit-Quantized — 70亿参数的量化文本生成模型

Llama-lynx-70b-4bitAWQ — 70亿参数的文本生成模型

glider-gguf — 高性能的量化语言模型

FastHunyuan — 快速生成高质量视频的模型

Recursal AI — 让人工智能触手可及

InternVL2_5-26B — 多模态大型语言模型，融合视觉与语言理解。

FineWeb2 — 多语言预训练数据集

mwp_ReFT — 基于深度强化学习的模型微调框架

PocketPal AI — AI聊天应用，提供安全私密的对话体验。

OLMo-2-1124-7B-Instruct — 高性能英文对话生成模型

OLMo 2 7B — 7B参数的大型语言模型，提升自然语言处理能力

Skywork-o1-Open-PRM-Qwen-2.5-1.5B — Skywork o1 Open系列模型，提升复杂问题解决能力

FLUX.1-dev-IP-Adapter — 基于FLUX.1-dev模型的IP-Adapter，实现图像工作如文本般灵活。

SD3.5-Large-IP-Adapter — 基于Stable Diffusion 3.5 Large模型的IP适配器

智谱清流 — 企业级AI智能体开发平台，快速构建专业级智能体。

Qwen2.5 Coder Artifacts — Hugging Face上由Qwen提供的编程工具集合

MobileLLM-350M — 高效优化的子十亿参数语言模型，专为设备端应用设计

Aya Expanse — 由CohereForAI开发的Hugging Face Space

MaskGCT TTS Demo — 基于MaskGCT模型的文本到语音演示

Reverb — 开源的语音识别和说话人分割模型推理代码

gradio-bot — 将Hugging Face Space或Gradio应用转化为Discord机器人

SFR-Judge — 加速模型评估和微调的智能评估工具

Flux.1-dev Controlnet Upscaler — 一款基于Hugging Face的图像放大模型。