DeepSeek-R1-Distill-Qwen-1.5B
DeepSeek-R1-Distill-Qwen-1.5B es un modelo de lenguaje de código abierto de alta eficiencia de inferencia, adecuado para diversas tareas de procesamiento del lenguaje natural.
Producto ComúnProgramaciónProcesamiento del lenguaje naturalAprendizaje por refuerzo
DeepSeek-R1-Distill-Qwen-1.5B es un modelo de lenguaje de código abierto desarrollado por el equipo DeepSeek, basado en la serie Qwen2.5 y optimizado mediante destilación. Este modelo, mediante aprendizaje por refuerzo a gran escala y técnicas de destilación de datos, mejora significativamente la capacidad y el rendimiento de la inferencia, manteniendo al mismo tiempo un tamaño de modelo reducido. Destaca en varias pruebas de referencia, especialmente en tareas de matemáticas, generación de código y razonamiento. Permite su uso comercial y la modificación y creación de obras derivadas, siendo adecuado para instituciones de investigación y empresas que buscan desarrollar aplicaciones de procesamiento del lenguaje natural de alto rendimiento.
DeepSeek-R1-Distill-Qwen-1.5B Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44