Prometheus-Eval
Conjunto de herramientas de código abierto para evaluar otros modelos de lenguaje.
Producto ComúnProgramaciónCódigo abiertoModelo de lenguaje
Prometheus-Eval es un conjunto de herramientas de código abierto para evaluar el rendimiento de los modelos de lenguaje extenso (LLM) en tareas de generación. Ofrece una interfaz sencilla que utiliza el modelo Prometheus para evaluar pares de instrucciones y respuestas. El modelo Prometheus 2 admite la evaluación directa (puntuación absoluta) y la clasificación por pares (puntuación relativa), simulando el juicio humano y las evaluaciones basadas en modelos de lenguaje propietarios. Esto resuelve problemas de equidad, controlabilidad y asequibilidad.
Prometheus-Eval Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34