OpenCompass 2.0 ist eine Plattform, die sich auf die Leistungsbewertung großer Sprachmodelle konzentriert. Sie verwendet mehrere proprietäre Datensätze für eine mehrdimensionale Bewertung und liefert eine Gesamtbewertung sowie Fachkompetenz-Scores für die Modelle. Durch die Echtzeitaktualisierung der Bestenliste unterstützt die Plattform Entwickler und Forscher dabei, die Leistung verschiedener Modelle in den Bereichen Sprache, Wissen, logisches Denken, Mathematik und Programmierung zu verstehen.