mistral-finetune

轻量级代码库，用于高效微调Mistral模型。

普通产品编程微调LoRA

mistral-finetune是一个轻量级的代码库，它基于LoRA训练范式，允许在冻结大部分权重的情况下，只训练1-2%的额外权重，以低秩矩阵微扰的形式进行微调。它被优化用于多GPU单节点训练设置，对于较小模型，例如7B模型，单个GPU就足够了。该代码库旨在提供简单、有指导意义的微调入口，特别是在数据格式化方面，并不旨在涵盖多种模型架构或硬件类型。

Best AI Websites & Tools

mistral-finetune

mistral-finetune 最新流量情况

mistral-finetune 访问量趋势

mistral-finetune 访问地理位置分布

mistral-finetune 流量来源

mistral-finetune 替代品

In-Context LoRA for Diffusion Transformers — 一种用于扩散变换器的上下文LoRA微调技术

SD3.5-LoRA-Linear-Red-Light — 基于文本生成高质量图像的AI模型

FLUX.1-dev-LoRA-Text-Poster — 基于FLUX.1-dev的文本到图像生成模型

AutoArena — 自动化的生成式AI评估平台

FLUX.1-dev-LoRA-One-Click-Creative-Template — 一键式创意图像生成模型

Momo XL — 动漫风格图像生成模型

iPhone Photo [FLUX] (iPhone Realism) - v1 final — 提高图片自然度和真实感的AI模型

OpenFLUX.1 — 开源的文本到图像生成模型

torchao — PyTorch原生量化和稀疏性训练与推理库

Llama-3.2-1B — 多语言大型语言模型

Future AGI — 革命性AI数据管理，提升99%准确率

Phi-3.5-mini-instruct — 轻量级、多语言的先进文本生成模型

ComfyUI-GGUF — GGUF量化支持，优化ComfyUI原生模型性能

Flux1.dev-AsianFemale — 探索Flux模型在亚洲女性形象上的适应性。

x-flux — 深度学习模型训练脚本集

flux-RealismLora — 基于FLUX.1-dev模型的LoRA文本到图像生成技术。

RAGFoundry — 一个用于增强LLMs检索增强生成任务的框架

Finetune — AI智能代理的微调平台

Mastering LLMs — 由实践者主导的LLMs公开课

lmms-finetune — 统一的代码库，用于微调大型多模态模型

Meta-Llama-3.1-8B-Instruct — 多语言对话生成模型

Meta-Llama-3.1-70B — 70亿参数的大型多语言文本生成模型

Mistral NeMo — 最先进的12B模型，支持多语言应用

Llama-3-70B-Tool-Use — 70B参数量的大型语言模型，专为工具使用优化

AMchat — 高等数学问题的智能解答助手

EmoLLM — 心理健康大模型，支持心理健康辅导链路。

Expert Specialized Fine-Tuning — 定制化大型语言模型的专业微调工具

OpenVLA — 开源视觉-语言-动作模型，推动机器人操作技术发展。

Higgs-Llama-3-70B — 专为角色扮演优化的大型语言模型