Qwen2 Math Demo: Das neue mathematische Modell von Tongyi Qianwen übertrifft GPT-4

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 4 Minuten Lesezeit · Aug 20, 2024

545

Alibabas „Tongyi Qianwen“-Team hat wieder einmal Großes geleistet! Sie haben gerade die Qwen2Math Demo veröffentlicht, ein mathematisches Modell, das wie ein kleines Wunder wirkt und sogar GPT-4 in den Schatten stellt.

Dieses Modell kann nicht nur mathematische Probleme aus Text lösen, sondern auch Formeln aus Bildern und Screenshots verstehen. Stellen Sie sich vor: Sie fotografieren eine Formel, und das Modell liefert Ihnen die Lösung – ein echter Problemlöser für den Matheunterricht! (Wir raten natürlich vom Schummeln ab.)

Qwen2-Math gibt es in drei Versionen: 72B, 7B und 1.5B. Die 72B-Version ist ein wahres Mathegenie und erzielte im MATH-Datensatz sogar 7 Punkte mehr als GPT-4, was einer Steigerung von 9,6 % entspricht. Das ist so, als würden Sie im Mathe-Abitur 145 Punkte erreichen, während Ihr Klassenkamerad nur 132 Punkte schafft.

Noch beeindruckender ist, dass die 7B-Version mit weniger als einem Zehntel der Parameter das Open-Source-Mathematikmodell NuminaMath (72B) übertrifft. NuminaMath wurde auf der ersten AIMO-Weltmeisterschaft ausgezeichnet, wobei die Auszeichnung vom „Top-Mathematiker“ Terence Tao persönlich überreicht wurde.

Alibabas leitender Algorithmus-Experte Lin Junyang verkündete begeistert, dass sie das Qwen2-Modell in einen Mathematik-Experten verwandelt haben. Wie haben sie das geschafft? Mit einer speziellen „Mathe-Power-Up“-Lösung – einem sorgfältig zusammengestellten, mathematischen Datensatz. Dieser „Power-Up“ enthält eine große Menge an hochwertigen mathematischen Online-Texten, Büchern, Codes, Prüfungsaufgaben und sogar selbst von Qwen2 erzeugte Mathematikaufgaben.

Das Ergebnis? In klassischen mathematischen Testdatenbanken wie GSM8K und MATH ließ Qwen2-Math-72B sogar Llama-3.1 (405B) hinter sich. Diese Testdatenbanken sind keine leichte Übung, sie enthalten algebraische, geometrische, probabilistische und zahlentheoretische Probleme.

Darüber hinaus hat sich Qwen2-Math an chinesischen Datensätzen wie CMATH und Abiturprüfungen gemessen. Selbst die 1.5B-Version übertrifft hier Llama3.1 (70B). Und in allen Versionen zeigen sich im Vergleich zu den gleich großen Qwen2-Basismodellen deutliche Leistungssteigerungen.

Es scheint, dass „Tongyi Qianwen“ tatsächlich ein mathematisches Genie hervorgebracht hat! Können wir es in Zukunft für unsere Matheaufgaben fragen? Denken Sie aber daran: Es ist nur ein Werkzeug. Lassen Sie sich nicht von seiner Intelligenz blenden – Ihre eigenen mathematischen Fähigkeiten müssen Sie weiterhin fleißig trainieren!

Online-Demo: https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo

OpenAI veröffentlicht GPT-4O-Audio-Preview: Sprachsteuerung mit Emotionserkennung!

OpenAI setzt erneut Maßstäbe in der KI-Technologie mit dem neuen Modell gpt-4o-audio-preview. Dieses Modell beeindruckt nicht nur durch seine Fähigkeiten in der Sprachgenerierung und -analyse, sondern eröffnet auch neue Möglichkeiten für die Mensch-Maschine-Interaktion. Werfen wir einen genaueren Blick auf die Eigenschaften und potenziellen Anwendungen dieses innovativen Modells. Die Kernfunktionen von gpt-4o-audio-preview lassen sich in drei Bereiche unterteilen: Erstens erzeugt es auf Basis von Text natürliche und flüssige Sprachantworten, was Anwendungen wie Sprachassistenten und virtuellen Kundenservice zugutekommt.

OpenAI neues Modell gpt-4o-2024-08-06 und gpt-4o-mini unterstützen strukturierte Ausgaben

OpenAI hat in seiner API die Funktion für strukturierte Ausgaben hinzugefügt, um sicherzustellen, dass die generierten Ausgaben vollständig dem vorgegebenen JSON-Schema entsprechen. Dies erhöht die Zuverlässigkeit der API und die Genauigkeit der Anwendungen deutlich. Diese Funktion definiert nicht nur die Struktur des JSON, sondern gewährleistet auch die Genauigkeit der Ausgabe. Gleichzeitig wurden die Preise gesenkt: Die Eingangs-Kosten wurden halbiert und die Ausgabe-Kosten um ein Drittel reduziert. Die Einführung strukturierter Ausgaben behebt die Einschränkungen von JSON-Schemas bei der Gewährleistung der Konformität der Ausgaben mit einer bestimmten Struktur und verbessert die Leistung des Modells bei strukturierten Ausgaben erheblich. Durch technologische Innovationen, wie z.B. Beschränkungen...

OpenAI veröffentlicht neues Modell gpt-4o-64k-output-alpha: GPT-4o API unterstützt nun bis zu 64K Output

Das herausragende Merkmal des neuen OpenAI-Modells gpt-4o-64k-output-alpha ist die Möglichkeit, bis zu 64K Tokens in einem einzigen Output zu generieren. Dies eignet sich ideal für die Erstellung umfangreicher und detaillierter Inhalte und erfüllt die Anforderungen von Schreibaufgaben, Programmierung und komplexen Datenanalysen. Diese Funktion erhöht jedoch den API-Preis: Die Kosten für eine Million Output-Tokens betragen 18 US-Dollar, im Vergleich dazu kosten eine Million Input-Tokens nur 6 US-Dollar. Dies soll den hohen Rechenkosten entsprechen und einen verantwortungsvollen Umgang mit diesem leistungsstarken Tool fördern. Das Modell ist für die Bereiche Kreativität und Forschung konzipiert.

KI-Nachrichten und -Informationen

Qwen2 Math Demo: Das neue mathematische Modell von Tongyi Qianwen übertrifft GPT-4

AIbase基地

Empfohlene verwandte KI-Nachrichten

OpenAI veröffentlicht GPT-4O-Audio-Preview: Sprachsteuerung mit Emotionserkennung!

OpenAI neues Modell gpt-4o-2024-08-06 und gpt-4o-mini unterstützen strukturierte Ausgaben

OpenAI veröffentlicht neues Modell gpt-4o-64k-output-alpha: GPT-4o API unterstützt nun bis zu 64K Output