SuperCLUE veröffentlichte die August-Rangliste für chinesische große Sprachmodelle. Diese umfasst eine Gesamtwertung, eine Rangliste für offene Fragen im OPEN-Mehrrunden-Dialog, eine Rangliste für objektive Aufgaben in drei Kategorien (OPT), eine Rangliste der zehn wichtigsten Fähigkeiten und eine Rangliste für Open-Source-Modelle. Für die Bewertung wurden 16 gängige große Sprachmodelle mit 3337 neuen Testaufgaben herangezogen. Die Bewertung ergab, dass die Leistungslücke zwischen inländischen großen Sprachmodellen und GPT-3.5 bei chinesischen Aufgaben kontinuierlich kleiner wird.
August-Rangliste! Neues Ranking des SuperCLUE-Benchmarks für chinesische große Sprachmodelle veröffentlicht
