Skywork-Reward-Gemma-2-27B
Modelo de recompensa avanzado basado en la arquitectura Gemma-2-27B
Producto ComúnProgramaciónModelo de RecompensaProcesamiento de Preferencias
Skywork-Reward-Gemma-2-27B es un modelo de recompensa avanzado basado en la arquitectura Gemma-2-27B, diseñado para gestionar preferencias en escenarios complejos. El modelo se entrenó con 80.000 pares de preferencias de alta calidad procedentes de diversos campos, como matemáticas, programación y seguridad. En septiembre de 2024, Skywork-Reward-Gemma-2-27B ocupó el primer lugar en la clasificación de RewardBench, demostrando su potente capacidad para el procesamiento de preferencias.
Skywork-Reward-Gemma-2-27B Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44