Nach einer zwölftägigen Reihe von technischen Präsentationen hat OpenAI am letzten Tag sein neues Inferenzmodell o3 vorgestellt, eine verbesserte Version des zuvor veröffentlichten o1-Inferenzmodells. Die o3-Modellreihe umfasst zwei Versionen: o3 und o3-mini. o3-mini ist eine kleinere, optimierte Version, die für spezifische Aufgaben feinabgestimmt wurde. OpenAI erklärte, dass das o3-Modell unter bestimmten Bedingungen der universellen künstlichen Intelligenz (AGI) nahekommt – also einer KI, die jede Aufgabe bewältigen kann, die ein Mensch auch bewältigen kann.

Im ARC-AGI-Benchmark für graphische logische Schlussfolgerungen erzielte das o3-Modell rekordverdächtige Ergebnisse: 75,7 % im Low-Compute-Szenario und 87,5 % im High-Compute-Test, womit es die Schwelle von 85 % übertraf, die als menschliches Niveau gilt. Zum Vergleich: Das o1-Modell erzielte nur Werte zwischen 25 % und 32 %. Die Leistung von o3 ist also fast dreimal so hoch wie die von o1. Auf der weltweit bekannten Code-Wettbewerbs-Plattform Codeforces erreichte o3 einen Score von 2727, während o1 nur 1891 erreichte.

微信截图_20241223134833.png

Fu Sheng, Vorsitzender von Cheetah Mobile und OrionStar, erklärte, dass die Veröffentlichung von OpenAI o3 das Zeitalter des „Jeder ist ein Programmierer“ einläutet. Benutzer müssen keine Experten in Python oder C sein, um Programme zu schreiben. Sie müssen lediglich ihre Anforderungen formulieren, und das große Sprachmodell erledigt den Rest der Programmierarbeit. Fu Sheng ist der Ansicht, dass die Veröffentlichung von o3 die Programmierfähigkeiten von großen Sprachmodellen über die von 99,9 % aller Programmierer hinaushebt. Im weltweiten Programmierwettbewerb Codeforces erreichte o3 einen Top-Platz 175, während o1 etwa 90 % der Programmierer übertraf. GPT-4o übertraf zuvor nur 11 % der Programmierer.

OpenAI plant, das o3-Modell Ende Januar nächsten Jahres offiziell zu veröffentlichen. Fu Sheng weist darauf hin, dass Programmierer zwar nicht ganz verschwinden werden, ihre Arbeit sich aber stärker auf das Verstehen von Benutzeranforderungen und den Aufbau großer Logiken konzentrieren wird. Die Umsetzung dieser Anforderungen in Code wird weitgehend von KI übernommen werden. Diese Veröffentlichung deutet darauf hin, dass die Anwendung von KI im Programmierbereich weiter verbreitet sein wird und auch die Arbeitsweise von Programmierern verändern könnte.