DeepSeek-R1-Distill-Qwen-7B
DeepSeek-R1-Distill-Qwen-7B é um modelo de raciocínio de código aberto, focado em tarefas de matemática, código e raciocínio.
Produto ComumProgramaçãoAprendizado por ReforçoModelo de Raciocínio
DeepSeek-R1-Distill-Qwen-7B é um modelo de raciocínio otimizado por aprendizado por reforço, baseado em Qwen-7B e otimizado por destilação. Ele se destaca em tarefas de matemática, código e raciocínio, capaz de gerar cadeias de raciocínio e soluções de alta qualidade. O modelo, através de aprendizado por reforço em larga escala e técnicas de destilação de dados, melhora significativamente a capacidade e a eficiência de raciocínio, sendo adequado para cenários que exigem raciocínio complexo e análise lógica.
DeepSeek-R1-Distill-Qwen-7B Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44