Alibabas „Tongyi Qianwen“-Team hat wieder einmal Großes geleistet! Sie haben gerade die Qwen2Math Demo veröffentlicht, ein mathematisches Modell, das wie ein kleines Wunder wirkt und sogar GPT-4 in den Schatten stellt.
Dieses Modell kann nicht nur mathematische Probleme aus Text lösen, sondern auch Formeln aus Bildern und Screenshots verstehen. Stellen Sie sich vor: Sie fotografieren eine Formel, und das Modell liefert Ihnen die Lösung – ein echter Problemlöser für den Matheunterricht! (Wir raten natürlich vom Schummeln ab.)
Qwen2-Math gibt es in drei Versionen: 72B, 7B und 1.5B. Die 72B-Version ist ein wahres Mathegenie und erzielte im MATH-Datensatz sogar 7 Punkte mehr als GPT-4, was einer Steigerung von 9,6 % entspricht. Das ist so, als würden Sie im Mathe-Abitur 145 Punkte erreichen, während Ihr Klassenkamerad nur 132 Punkte schafft.
Noch beeindruckender ist, dass die 7B-Version mit weniger als einem Zehntel der Parameter das Open-Source-Mathematikmodell NuminaMath (72B) übertrifft. NuminaMath wurde auf der ersten AIMO-Weltmeisterschaft ausgezeichnet, wobei die Auszeichnung vom „Top-Mathematiker“ Terence Tao persönlich überreicht wurde.
Alibabas leitender Algorithmus-Experte Lin Junyang verkündete begeistert, dass sie das Qwen2-Modell in einen Mathematik-Experten verwandelt haben. Wie haben sie das geschafft? Mit einer speziellen „Mathe-Power-Up“-Lösung – einem sorgfältig zusammengestellten, mathematischen Datensatz. Dieser „Power-Up“ enthält eine große Menge an hochwertigen mathematischen Online-Texten, Büchern, Codes, Prüfungsaufgaben und sogar selbst von Qwen2 erzeugte Mathematikaufgaben.
Das Ergebnis? In klassischen mathematischen Testdatenbanken wie GSM8K und MATH ließ Qwen2-Math-72B sogar Llama-3.1 (405B) hinter sich. Diese Testdatenbanken sind keine leichte Übung, sie enthalten algebraische, geometrische, probabilistische und zahlentheoretische Probleme.
Darüber hinaus hat sich Qwen2-Math an chinesischen Datensätzen wie CMATH und Abiturprüfungen gemessen. Selbst die 1.5B-Version übertrifft hier Llama3.1 (70B). Und in allen Versionen zeigen sich im Vergleich zu den gleich großen Qwen2-Basismodellen deutliche Leistungssteigerungen.
Es scheint, dass „Tongyi Qianwen“ tatsächlich ein mathematisches Genie hervorgebracht hat! Können wir es in Zukunft für unsere Matheaufgaben fragen? Denken Sie aber daran: Es ist nur ein Werkzeug. Lassen Sie sich nicht von seiner Intelligenz blenden – Ihre eigenen mathematischen Fähigkeiten müssen Sie weiterhin fleißig trainieren!
Online-Demo: https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo