Ranking de Productos de IA

Ranking de Productos de IA

Busca la dinámica global de productos de IA

Busca información global de IA y descubre nuevas oportunidades de IA

Información de Noticias
Aplicaciones de Productos
Casos de Monetización
Tutoriales de IA

Tipo :

Información de Noticias
Aplicaciones de Productos
Casos de Monetización
Tutoriales de IA

2025-03-14 10:07:07.AIbase

El equipo de 360智脑 reproduce con éxito el efecto del aprendizaje por refuerzo de Deepseek y publica el modelo de código abierto Light-R1-14B-DS

Recientemente, el equipo de 360智脑 anunció que ha reproducido con éxito el efecto del aprendizaje por refuerzo de Deepseek y ha publicado oficialmente el modelo de inferencia de código abierto Light-R1-14B-DS. El rendimiento de este modelo supera a DeepSeek-R1-Distill-Llama-70B y DeepSeek-R1-Distill-Qwen-32B, convirtiéndose en el primer modelo de la industria en lograr un efecto de aprendizaje por refuerzo con una escala de parámetros de 14B, lo que mejora significativamente su capacidad de razonamiento matemático y supera los resultados de la mayoría de los modelos de 32B.

El equipo de 360智脑 reproduce con éxito el efecto del aprendizaje por refuerzo de Deepseek y publica el modelo de código abierto Light-R1-14B-DS