Skywork-Reward-Gemma-2-27B

Modelo de recompensa avanzado basado en la arquitectura Gemma-2-27B

Producto ComúnProgramaciónModelo de RecompensaProcesamiento de Preferencias
Skywork-Reward-Gemma-2-27B es un modelo de recompensa avanzado basado en la arquitectura Gemma-2-27B, diseñado para gestionar preferencias en escenarios complejos. El modelo se entrenó con 80.000 pares de preferencias de alta calidad procedentes de diversos campos, como matemáticas, programación y seguridad. En septiembre de 2024, Skywork-Reward-Gemma-2-27B ocupó el primer lugar en la clasificación de RewardBench, demostrando su potente capacidad para el procesamiento de preferencias.
Abrir sitio web

Skywork-Reward-Gemma-2-27B Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

Skywork-Reward-Gemma-2-27B Tendencia de visitas

Skywork-Reward-Gemma-2-27B Distribución geográfica de las visitas

Skywork-Reward-Gemma-2-27B Fuentes de tráfico

Skywork-Reward-Gemma-2-27B Alternativas