es
Ranking de Productos de IA
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
Inicio
Noticias de IA
AI Diario
Guías de Monetización
Tutoriales de IA
Navegación de Herramientas de IA
Biblioteca de Productos de IA
es
Ranking de Productos de IA
Busca la dinámica global de productos de IA
Busca información global de IA y descubre nuevas oportunidades de IA
Información de Noticias
Aplicaciones de Productos
Casos de Monetización
Tutoriales de IA
Tipo :
Información de Noticias
Aplicaciones de Productos
Casos de Monetización
Tutoriales de IA
2025-03-14 10:07:07
.
AIbase
.
16.3k
El equipo de 360智脑 reproduce con éxito el efecto del aprendizaje por refuerzo de Deepseek y publica el modelo de código abierto Light-R1-14B-DS
Recientemente, el equipo de 360智脑 anunció que ha reproducido con éxito el efecto del aprendizaje por refuerzo de Deepseek y ha publicado oficialmente el modelo de inferencia de código abierto Light-R1-14B-DS. El rendimiento de este modelo supera a DeepSeek-R1-Distill-Llama-70B y DeepSeek-R1-Distill-Qwen-32B, convirtiéndose en el primer modelo de la industria en lograr un efecto de aprendizaje por refuerzo con una escala de parámetros de 14B, lo que mejora significativamente su capacidad de razonamiento matemático y supera los resultados de la mayoría de los modelos de 32B.