Prometheus-Eval
Conjunto de ferramentas de código aberto para avaliar outros modelos de linguagem.
Produto ComumProgramaçãoCódigo abertoModelo de linguagem
Prometheus-Eval é um conjunto de ferramentas de código aberto para avaliar o desempenho de grandes modelos de linguagem (LLM) em tarefas de geração. Ele fornece uma interface simples que usa o modelo Prometheus para avaliar pares de instruções e respostas. O modelo Prometheus 2 suporta avaliação direta (pontuação absoluta) e classificação em pares (pontuação relativa), podendo simular julgamentos humanos e avaliações proprietárias baseadas em modelos de linguagem, solucionando problemas de equidade, controlabilidade e custo.
Prometheus-Eval Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34