Skywork-Reward-Gemma-2-27B
Modelo de recompensa avançado baseado na arquitetura Gemma-2-27B
Produto ComumProgramaçãoModelo de RecompensaProcessamento de Preferências
Skywork-Reward-Gemma-2-27B é um modelo de recompensa avançado baseado na arquitetura Gemma-2-27B, projetado para lidar com preferências em cenários complexos. O modelo foi treinado com 80 mil pares de preferências de alta qualidade, provenientes de diversas áreas, incluindo matemática, programação e segurança. Em setembro de 2024, o Skywork-Reward-Gemma-2-27B ocupou o primeiro lugar no ranking RewardBench, demonstrando sua poderosa capacidade de processamento de preferências.
Skywork-Reward-Gemma-2-27B Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44