Skywork-Reward-Llama-3.1-8B

Modelo de recompensa avanzado para clasificación de texto y juicio de preferencia.

Producto ComúnProgramaciónAprendizaje automáticoProcesamiento del lenguaje natural
Skywork-Reward-Llama-3.1-8B es un modelo de recompensa avanzado basado en la arquitectura Meta-Llama-3.1-8B-Instruct, entrenado con Skywork Reward Data Collection, un conjunto de datos que contiene 80.000 pares de preferencias de alta calidad. El modelo destaca en el manejo de preferencias en escenarios complejos, incluyendo pares de preferencias desafiantes, y abarca múltiples áreas como matemáticas, programación y seguridad. A septiembre de 2024, este modelo ocupa el tercer lugar en el ranking de RewardBench.
Abrir sitio web

Skywork-Reward-Llama-3.1-8B Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

Skywork-Reward-Llama-3.1-8B Tendencia de visitas

Skywork-Reward-Llama-3.1-8B Distribución geográfica de las visitas

Skywork-Reward-Llama-3.1-8B Fuentes de tráfico

Skywork-Reward-Llama-3.1-8B Alternativas