aimo-progress-prize
Lösung für die AI-Mathematikolympiade
Normales ProduktBildungKIMathematik
Dieses GitHub-Repository enthält den Trainings- und Inferenzcode zur Reproduktion unserer Gewinnerlösung beim AI Mathematics Olympiad (AIMO) Progress Prize 1. Unsere Lösung besteht aus vier Hauptteilen: einer Rezeptur zum Feintuning von DeepSeekMath-Base 7B zur Lösung mathematischer Probleme mithilfe von Tool-Integrated Reasoning (TIR); zwei hochwertigen Trainingsdatensätzen mit jeweils etwa 1 Million mathematischen Problemen und Lösungen; einem selbstkonsistenten Dekodierungsalgorithmus zur Generierung von Lösungsvorschlägen mit Codeausführungsfeedback (SC-TIR); und vier sorgfältig ausgewählten Validierungsmengen aus AMC, AIME und MATH, um die Modellselektion zu leiten und ein Überanpassen an öffentliche Ranglisten zu vermeiden.
aimo-progress-prize Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34