Vor kurzem stellten Elon Musk und sein Team im Livestream Grok3 vor und bezeichneten es als die „intelligenteste künstliche Intelligenz der Erde“. Musk erklärte außerdem, dass Grok3 in Benchmark-Tests für Mathematik, Naturwissenschaften und Programmierung alle gängigen KI-Modelle übertrifft und für Berechnungen bei SpaceX-Marsmissionen eingesetzt werden soll. Er prognostizierte sogar einen Nobelpreis-würdigen Durchbruch innerhalb der nächsten drei Jahre.

QQ_1739945040608.png

Die Leistung von Grok3 in realen Tests war jedoch enttäuschend. Nach der Präsentation testeten einige Medien Grok3 und stellten eine klassische Frage: „Was ist größer: 9,11 oder 9,9?“. Überraschenderweise konnte die angeblich intelligenteste KI die richtige Antwort nicht geben, was bei den Nutzern zu Spott führte – „Ein Genie, das keine einfachen Fragen beantworten will“.

Musk antwortete darauf, dass Grok3 derzeit nur eine Testversion sei und in dieser Phase möglichst viele Fehler gemacht werden sollten. Die vollständige Version soll in den nächsten Monaten erscheinen.

Offizielle Angaben zeigen, dass Grok3 im Chatbot-Arena-Wettbewerb gut abgeschnitten hat, aber der Abstand zu den Konkurrenten DeepSeek R1 und GPT-4.0 nur bei 1% bis 2% liegt. Musk gab auf der Präsentation bekannt, dass für Grok3 über 200.000 H100-Chips verwendet wurden und die Gesamttrainingszeit zwei Millionen Stunden betrug.