DeepSeek-R1-Distill-Qwen-1.5B

DeepSeek-R1-Distill-Qwen-1.5B es un modelo de lenguaje de código abierto de alta eficiencia de inferencia, adecuado para diversas tareas de procesamiento del lenguaje natural.

Producto ComúnProgramaciónProcesamiento del lenguaje naturalAprendizaje por refuerzo
DeepSeek-R1-Distill-Qwen-1.5B es un modelo de lenguaje de código abierto desarrollado por el equipo DeepSeek, basado en la serie Qwen2.5 y optimizado mediante destilación. Este modelo, mediante aprendizaje por refuerzo a gran escala y técnicas de destilación de datos, mejora significativamente la capacidad y el rendimiento de la inferencia, manteniendo al mismo tiempo un tamaño de modelo reducido. Destaca en varias pruebas de referencia, especialmente en tareas de matemáticas, generación de código y razonamiento. Permite su uso comercial y la modificación y creación de obras derivadas, siendo adecuado para instituciones de investigación y empresas que buscan desarrollar aplicaciones de procesamiento del lenguaje natural de alto rendimiento.
Abrir sitio web

DeepSeek-R1-Distill-Qwen-1.5B Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

DeepSeek-R1-Distill-Qwen-1.5B Tendencia de visitas

DeepSeek-R1-Distill-Qwen-1.5B Distribución geográfica de las visitas

DeepSeek-R1-Distill-Qwen-1.5B Fuentes de tráfico

DeepSeek-R1-Distill-Qwen-1.5B Alternativas