Das OpenAI GPT-4.5-Modell eroberte innerhalb von sechs Stunden nach seiner Veröffentlichung den Spitzenplatz im KI-Wettbewerb und wurde zum Ersten in der All-Task-Klassifizierung. Dieser Ruhm währte jedoch nicht lange: Das xAI Grok-3-Modell von Musk holte schnell auf und überholte es an der Spitze der Gesamtwertung.
Laut Abstimmungsdaten erhielten GPT-4.5 und Grok-3 jeweils über 3000 Stimmen, mit einer Endpunktzahl von 1412 zu 1411 – ein hauchdünner Vorsprung. Obwohl GPT-4.5 in den meisten Bereichen hervorragende Leistungen zeigte, hatte Grok-3 bei bestimmten Aufgaben wie „Stilkontrolle“ und „schwierige Eingabeaufforderungen“ einen leichten Vorteil, was ihm den Gesamtsieg einbrachte.
Bildquelle: Das Bild wurde von KI generiert und von Midjourney lizenziert.
Die „Sechs-Stunden-Wende“ stieß bei vielen Nutzern auf Zweifel, ob eine so schnelle Veränderung plausibel sei. Branchenexperten erklärten dies damit, dass die Rangliste eine Abstimmungs-Schwelle hat: Nur Modelle, die innerhalb des gleichen Zeitraums 3000 Stimmen erreichen, werden in die Rangliste aufgenommen. Daher war es ein Zufall, dass die beiden kurz nach der Veröffentlichung gleichzeitig diesen Standard erreichten.
Bemerkenswert ist, dass GPT-4.5, obwohl es bei der Veröffentlichung auf einige negative Bewertungen stieß, im Nachhinein eine deutlich gestiegene Anerkennung für seine hohe soziale Kompetenz erfuhr. Sam Altman, CEO von OpenAI, teilte sogar ein Gespräch mit GPT-4.5 und berichtete, dass er zum ersten Mal von Nutzern gebeten wurde, die Entfernung des Modells zu versprechen.
Gleichzeitig erzielte GPT-4.5 in einem ungewöhnlichen Wettbewerb hervorragende Ergebnisse, indem es an einem Spiel teilnahm, das einem „Werwolf-Spiel mit großen Modellen“ ähnelt. In diesem Spiel müssen die KI-Modelle debattieren, Strategien entwickeln und abstimmen. Der Gewinner wird von einer Jury aus ausgeschiedenen Mitgliedern bestimmt. GPT-4.5 zeigte dabei übermenschliche Fähigkeiten in Zusammenarbeit, Täuschung und Strategieentwicklung.
All dies zeigt, dass der Wettbewerb im Bereich der künstlichen Intelligenz immer intensiver wird und die verschiedenen Modelle in ihren jeweiligen Bereichen ständig Innovationen und Verbesserungen vorantreiben. Wer diesen „Krieg der Intelligenz“ letztendlich gewinnen wird, bleibt abzuwarten und ist eine spannende Frage für die Zukunft.