27. Februar 2025 – OpenAI hat heute sein neuestes Sprachmodell GPT-4.5 als Forschungsvorschau für ChatGPT Pro-Nutzer (monatliches Abonnement: 200 US-Dollar) veröffentlicht. Dieses als „bisher größtes und wissendste“ Modell bezeichnete System baut auf GPT-4o auf und bietet erhebliche Verbesserungen in Bezug auf Schlussfolgerungsfähigkeit, emotionale Intelligenz sowie praktische Funktionen wie Schreiben und Programmieren. OpenAI gab bekannt, dass GPT-4.5 in den kommenden Wochen schrittweise für Plus-, Team-, Enterprise- und Edu-Nutzer verfügbar sein wird, was einen weiteren Meilenstein in der künstlichen Intelligenz darstellt.
Highlights: Intelligenter und natürlicher
GPT-4.5 zeigt in mehreren Bereichen bemerkenswerte Fortschritte. Laut der von OpenAI veröffentlichten Systemkarte wurde das Modell durch Supervised Fine-Tuning (SFT) und Reinforcement Learning from Human Feedback (RLHF) trainiert, wodurch „Halluzinationen“ (falsche oder erfundene Informationen) deutlich reduziert und die emotionale Intelligenz sowie die Natürlichkeit der Benutzerinteraktion verbessert wurden. Beispielsweise liegt die Halluzinationsrate von GPT-4.5 im PersonQA-Test bei nur 19 %, deutlich unter den 52 % von GPT-4o. In Bezug auf die Benutzererfahrung zeigt GPT-4.5 hervorragende Leistungen bei Schreib- und Programmieraufgaben und kann kreativere und ästhetisch ansprechendere Inhalte generieren, während es die Benutzerabsichten genauer versteht. X-Nutzer Simon Willison sagte nach einem Test: „Es ist besser in der Wissenstiefe und der Generierung von Inhalten (z. B. Zeichnen eines Pelikans), und die Interaktion ist natürlicher.“ Darüber hinaus unterstützt das Modell das Hochladen von Dateien und Bildern und integriert das Zeichenwerkzeug von ChatGPT, unterstützt aber derzeit noch keine multimodalen Funktionen wie Sprache, Video oder Bildschirmfreigabe.
Daten und Sicherheit: Transparenz und Verantwortung
OpenAI gab bekannt, dass die Trainingsdaten von GPT-4.5 aus verschiedenen Quellen stammen, darunter öffentliche Daten, Daten von exklusiven Partnern und interne, maßgeschneiderte Datensätze. Diese wurden streng gefiltert, um die Qualität zu gewährleisten und die Privatsphäre zu schützen. Im Bereich Sicherheit ist das Modell mit einer Moderation API und einem Klassifikator ausgestattet, um die Generierung schädlicher Inhalte effektiv zu verhindern. In Drittanbieter-Bewertungen haben Apollo Research und METR das Betrugsrisiko und die Autonomie von GPT-4.5 getestet. Die Ergebnisse zeigen ein insgesamt „mittleres“ Risiko. Besonders im Bereich Chemie, Biologie, radioaktive Kernmaterialien (CBRN) und Überzeugungskraft ist das Risiko mittel, während das Risiko im Bereich Cybersicherheit und Modell-Autonomie geringer ist. OpenAI hat Maßnahmen ergriffen, wie z. B. das Vorfiltern von CBRN-Daten im Pretraining und die Überwachung potenziellen Missbrauchs, um die Sicherheit zu gewährleisten.
Benutzerfeedback: Verbesserte Fähigkeiten, aber Optimierung der Geschwindigkeit erforderlich
Das Feedback der ersten Nutzer zeigt, dass GPT-4.5 in Bezug auf Wissen und Kreativität sehr gut bewertet wird. X-Nutzer @pckraftwerk lobte die „deutlich verbesserte Schreib- und Codierfähigkeit und die reduzierten Halluzinationen“. Probleme mit der Geschwindigkeit wurden jedoch ebenfalls angesprochen. Simon Willison wies darauf hin, dass GPT-4.5 über die API langsamer reagiert, was Echtzeitanwendungen beeinträchtigen könnte. Er gab auch bekannt, dass das Modell zehnmal mehr Trainingsrechenressourcen als GPT-4 verwendet hat, was die Leistungssteigerung mit hohen Investitionen verbindet.
Darüber hinaus stellte OpenAI klar, dass GPT-4.5 nicht für tiefes Schlussfolgern entwickelt wurde und empfahl Benutzern, bei komplexen Schlussfolgerungen die Modelle o1 oder o3-mini zu verwenden. Diese Positionierung hat zu einigen Diskussionen geführt.
Marktwirkung und Zukunftsaussichten
Als jüngstes Werk von OpenAI wird erwartet, dass GPT-4.5 die Produktivität in Bereichen wie Schreiben, Programmieren und Problemlösung revolutionieren wird. Seine mehrsprachigen Leistungen sind ebenfalls beeindruckend. Im MMLU-Benchmark-Test erreichte es eine Genauigkeit von 0,896 bei Englisch, 0,8840 bei Spanisch und 0,8598 bei Arabisch und übertraf damit GPT-4o deutlich. Branchenexperten prognostizieren, dass die leistungsstarken Funktionen und die hohe Sicherheit von GPT-4.5 mit der schrittweisen Einführung die führende Position von OpenAI im Bereich KI weiter festigen werden. Zukünftig plant OpenAI, das Modell auf der Grundlage von Benutzerfeedback zu optimieren und möglicherweise Funktionen wie Sprache und Video hinzuzufügen, um die Anwendungsszenarien weiter zu erweitern.
Schlussfolgerung
Die Veröffentlichung von GPT-4.5 zeigt nicht nur den technischen Ehrgeiz von OpenAI, sondern auch die Bedeutung, die es Sicherheit und Benutzererfahrung beimisst. Obwohl das Geschwindigkeitsproblem noch gelöst werden muss, hat dieses Modell zweifellos ein neues Kapitel in der Entwicklung der KI aufgeschlagen. Wie OpenAI in seiner Erklärung sagte: „Wir hoffen, dass GPT-4.5 den Benutzern eine intelligentere und zuverlässigere Assistentenerfahrung bietet.“