Skywork-Reward-Llama-3.1-8B
Modelo de recompensa avanzado para clasificación de texto y juicio de preferencia.
Producto ComúnProgramaciónAprendizaje automáticoProcesamiento del lenguaje natural
Skywork-Reward-Llama-3.1-8B es un modelo de recompensa avanzado basado en la arquitectura Meta-Llama-3.1-8B-Instruct, entrenado con Skywork Reward Data Collection, un conjunto de datos que contiene 80.000 pares de preferencias de alta calidad. El modelo destaca en el manejo de preferencias en escenarios complejos, incluyendo pares de preferencias desafiantes, y abarca múltiples áreas como matemáticas, programación y seguridad. A septiembre de 2024, este modelo ocupa el tercer lugar en el ranking de RewardBench.
Skywork-Reward-Llama-3.1-8B Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44