PromptBench
Ein einheitliches Bewertungsframework für Sprachmodelle
Normales ProduktProgrammierungBenchmarkBewertung
PromptBench ist ein Python-Paket, basierend auf PyTorch, zur Bewertung großer Sprachmodelle (LLMs). Es bietet Forschern eine benutzerfreundliche API zur LLM-Evaluierung. Hauptfunktionen umfassen: Schnelle Modellleistungsbewertung, Prompt Engineering, Bewertung von gegnerischen Prompts und dynamische Bewertung. Vorteile sind einfache Bedienung und schnelle Einarbeitung in die Bewertung bestehender Datensätze und Modelle, sowie die einfache Anpassung an eigene Datensätze und Modelle. Positionierung als einheitliche Open-Source-Bibliothek zur LLM-Bewertung.
PromptBench Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34