Prometheus-Eval

Conjunto de herramientas de código abierto para evaluar otros modelos de lenguaje.

Producto ComúnProgramaciónCódigo abiertoModelo de lenguaje
Prometheus-Eval es un conjunto de herramientas de código abierto para evaluar el rendimiento de los modelos de lenguaje extenso (LLM) en tareas de generación. Ofrece una interfaz sencilla que utiliza el modelo Prometheus para evaluar pares de instrucciones y respuestas. El modelo Prometheus 2 admite la evaluación directa (puntuación absoluta) y la clasificación por pares (puntuación relativa), simulando el juicio humano y las evaluaciones basadas en modelos de lenguaje propietarios. Esto resuelve problemas de equidad, controlabilidad y asequibilidad.
Abrir sitio web

Prometheus-Eval Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

Prometheus-Eval Tendencia de visitas

Prometheus-Eval Distribución geográfica de las visitas

Prometheus-Eval Fuentes de tráfico

Prometheus-Eval Alternativas