Kürzlich hat OpenAI sein mit Spannung erwartetes KI-Modell, zuvor unter dem Codenamen „Erdbeere“ bekannt, offiziell als „o1-preview“ veröffentlicht.

OpenAI versprach, dass dieses neue Modell in anspruchsvollen Benchmark-Aufgaben in Physik, Chemie und Biologie mit Doktoranden mithalten könne. Erste Tests zeigen jedoch, dass die KI noch weit davon entfernt ist, menschliche Wissenschaftler oder Programmierer zu ersetzen.

In den sozialen Medien teilten viele Nutzer ihre Erfahrungen mit der „OpenAI o1“-KI und berichteten von Fehlern bei grundlegenden Aufgaben.

So stellte der Forscher Mathieu Acher von der INSA Rennes fest, dass OpenAI o1 bei einigen Schach-Rätseln häufig ungültige Züge vorschlug.

image.png

Der Meta-AI-Wissenschaftler Colin Fraser bemerkte, dass die KI bei einem einfachen Texträtsel über einen Bauern, der Schafe über einen Fluss transportiert, die richtige Lösung verwarf und stattdessen sinnloses Zeug ausgab.

image.png

Selbst bei den von OpenAI als Demo verwendeten Logikrätseln, die Erdbeeren zum Thema hatten, erhielten Nutzer unterschiedliche Antworten. Ein Nutzer stellte eine Fehlerquote von 75 % fest.

image.png

Einige Nutzer berichteten sogar, dass das neue Modell oft Fehler machte, als es die Anzahl des Buchstabens „R“ im Wort „strawberry“ zählen sollte.

image.png

Obwohl OpenAI bei der Veröffentlichung angab, dass es sich um ein frühes Modell handelt, das noch keine Funktionen wie Web-Browsing oder Datei-Upload besitzt, sind diese grundlegenden Fehler dennoch überraschend.

Zur Verbesserung wurde in dem neuen Modell der „Gedankenketten“-Prozess eingeführt, der OpenAI o1 deutlich von dem vorherigen GPT-4o-Modell unterscheidet. Diese Methode erlaubt es der KI, vor der Ausgabe einer Antwort mehrfach zu überprüfen, was jedoch auch zu längeren Antwortzeiten führt.

Ein Nutzer stellte fest, dass das Modell 92 Sekunden benötigte, um die Antwort auf ein Texträtsel zu geben – die Antwort war jedoch falsch.

image.png

OpenAIs Forschungsleiter Noam Brown erklärte dazu, dass die derzeitige Antwortgeschwindigkeit zwar langsam sei, aber sie erwarten, dass zukünftige Versionen längere Überlegungen anstellen und möglicherweise sogar neue Erkenntnisse zu bahnbrechenden Problemen liefern können.

Der bekannte KI-Kritiker Gary Marcus äußerte sich jedoch skeptisch und argumentierte, dass lange Verarbeitungszeiten nicht unbedingt zu überlegenen Schlussfolgerungsfähigkeiten führen. Er betonte, dass trotz der fortschreitenden KI-Technologie reale Forschung und Experimente unerlässlich bleiben.

Zusammenfassend lässt sich sagen, dass die Leistung des neuen KI-Modells von OpenAI in der Praxis enttäuschend ist und dies eine Diskussion über die zukünftige Entwicklung der KI-Technologie ausgelöst hat.

Wichtigste Punkte:

🌟 OpenAI hat kürzlich das neue KI-Modell „Erdbeere“ vorgestellt und behauptet, es könne in komplexen Aufgaben mit Doktoranden mithalten.

🤖 Viele Nutzer stellten fest, dass die KI bei grundlegenden Aufgaben häufig Fehler macht, z. B. ungültige Züge in Schachspielen vorschlägt und einfache Rätsel falsch beantwortet.

💬 OpenAI räumt ein, dass sich das Modell noch in der Entwicklung befindet, aber langes Nachdenken führt nicht unbedingt zu besseren Schlussfolgerungen. Viele grundlegende Probleme sind noch ungelöst.