Ergebnisse des ersten AI-Gaokao-Tests veröffentlicht: GPT-4o belegt den zweiten Platz

AIbase

Veröffentlicht amKI-Nachrichten und -Informationen · 4 Minuten Lesezeit · Jun 20, 2024

186

In der Welt der künstlichen Intelligenz ist das Gaokao (chinesische Hochschulzugangsprüfung) nicht mehr nur eine Bühne für Menschen. Kürzlich ließ das Shanghai Artificial Intelligence Laboratory mit einer außergewöhnlichen „Gaokao“-Prüfung die akademischen Fähigkeiten von KI aufblitzen. Sie nutzten das OpenCompass-Bewertungssystem, um sieben KI-Modelle, darunter GPT-4o, in den Fächern Chinesisch, Mathematik und Englisch umfassend zu testen.

2_1718848649312_ai2023_A_large_classroom_filled_with_rows_of_robots_sitting_at__db532bea-895e-4609-b80c-5fedf4ecf846.png

Bildquelle: KI-generiertes Bild, Bildrechte: Midjourney

Für den Test wurde die landesweit gültige Version I des neuen Lehrplans verwendet. Alle beteiligten Open-Source-Modelle wurden vor der Gaokao veröffentlicht, um die Fairness des Tests zu gewährleisten. Die „Antwortbögen“ der KIs wurden von erfahrenen Gaokao-Korrektoren bewertet, um möglichst objektive Ergebnisse zu erzielen.

Die bewerteten Modelle stammten aus unterschiedlichen Quellen: Mixtral8x22B, ein von der französischen KI-Firma Mistral veröffentlichtes Dialogmodell; Yi-1.5-34B von Zero One Wanwu; GLM-4-9B von Zhipu AI; InternLM2-20B-WQX vom Shanghai Artificial Intelligence Laboratory; und die Qwen2-Serie von Alibaba. GPT-4o, ein geschlossenes Modell, diente lediglich als Referenz.

Das Ergebnis: Qwen2-72B erreichte mit 303 Punkten den ersten Platz, gefolgt von GPT-4o mit 296 Punkten und InternLM2-20B-WQX mit 295,5 Punkten. Die Modelle schnitten in Chinesisch und Englisch gut ab; die durchschnittliche Punktzahl in Chinesisch lag bei 67 %, in Englisch sogar bei 81 %. In Mathematik hingegen lag die durchschnittliche Punktzahl aller Modelle nur bei 36 %, was zeigt, dass KI im Bereich des mathematischen Denkens noch erhebliche Verbesserungspotenziale aufweist.

Die Korrektoren analysierten die Antworten der KI-Modelle umfassend. Im Fach Chinesisch bewältigten die Modelle das Verständnis moderner Texte im Allgemeinen gut, hatten aber bei klassischer Literatur und Aufsätzen Schwierigkeiten. In Mathematik zeigten die Modelle zwar ein gutes Formelgedächtnis, aber ihre Fähigkeit, Formeln flexibel anzuwenden, war noch mangelhaft. Der Englischtest wurde insgesamt gut gemeistert, aber bei einigen Aufgabentypen erzielten einige Modelle niedrigere Punktzahlen.

Diese „Gaokao für große Sprachmodelle“ zeigte nicht nur das Potenzial der KI im akademischen Bereich, sondern auch ihre Grenzen beim Verständnis und der Anwendung von Wissen. Mit dem Fortschritt der Technologie dürfen wir erwarten, dass zukünftige KIs intelligenter werden und der menschlichen Gesellschaft besser dienen.

OpenAI veröffentlicht GPT-4O-Audio-Preview: Sprachsteuerung mit Emotionserkennung!

OpenAI setzt erneut Maßstäbe in der KI-Technologie mit dem neuen Modell gpt-4o-audio-preview. Dieses Modell beeindruckt nicht nur durch seine Fähigkeiten in der Sprachgenerierung und -analyse, sondern eröffnet auch neue Möglichkeiten für die Mensch-Maschine-Interaktion. Werfen wir einen genaueren Blick auf die Eigenschaften und potenziellen Anwendungen dieses innovativen Modells. Die Kernfunktionen von gpt-4o-audio-preview lassen sich in drei Bereiche unterteilen: Erstens erzeugt es auf Basis von Text natürliche und flüssige Sprachantworten, was Anwendungen wie Sprachassistenten und virtuellen Kundenservice zugutekommt.

OpenAI neues Modell gpt-4o-2024-08-06 und gpt-4o-mini unterstützen strukturierte Ausgaben

OpenAI hat in seiner API die Funktion für strukturierte Ausgaben hinzugefügt, um sicherzustellen, dass die generierten Ausgaben vollständig dem vorgegebenen JSON-Schema entsprechen. Dies erhöht die Zuverlässigkeit der API und die Genauigkeit der Anwendungen deutlich. Diese Funktion definiert nicht nur die Struktur des JSON, sondern gewährleistet auch die Genauigkeit der Ausgabe. Gleichzeitig wurden die Preise gesenkt: Die Eingangs-Kosten wurden halbiert und die Ausgabe-Kosten um ein Drittel reduziert. Die Einführung strukturierter Ausgaben behebt die Einschränkungen von JSON-Schemas bei der Gewährleistung der Konformität der Ausgaben mit einer bestimmten Struktur und verbessert die Leistung des Modells bei strukturierten Ausgaben erheblich. Durch technologische Innovationen, wie z.B. Beschränkungen...

OpenAI veröffentlicht neues Modell gpt-4o-64k-output-alpha: GPT-4o API unterstützt nun bis zu 64K Output

Das herausragende Merkmal des neuen OpenAI-Modells gpt-4o-64k-output-alpha ist die Möglichkeit, bis zu 64K Tokens in einem einzigen Output zu generieren. Dies eignet sich ideal für die Erstellung umfangreicher und detaillierter Inhalte und erfüllt die Anforderungen von Schreibaufgaben, Programmierung und komplexen Datenanalysen. Diese Funktion erhöht jedoch den API-Preis: Die Kosten für eine Million Output-Tokens betragen 18 US-Dollar, im Vergleich dazu kosten eine Million Input-Tokens nur 6 US-Dollar. Dies soll den hohen Rechenkosten entsprechen und einen verantwortungsvollen Umgang mit diesem leistungsstarken Tool fördern. Das Modell ist für die Bereiche Kreativität und Forschung konzipiert.

KI-Nachrichten und -Informationen

Ergebnisse des ersten AI-Gaokao-Tests veröffentlicht: GPT-4o belegt den zweiten Platz

AIbase

Empfohlene verwandte KI-Nachrichten

OpenAI veröffentlicht GPT-4O-Audio-Preview: Sprachsteuerung mit Emotionserkennung!

OpenAI neues Modell gpt-4o-2024-08-06 und gpt-4o-mini unterstützen strukturierte Ausgaben

OpenAI veröffentlicht neues Modell gpt-4o-64k-output-alpha: GPT-4o API unterstützt nun bis zu 64K Output