Musks neuer Grok 3 enttäuscht mit fragwürdiger Intelligenz: Fehler bei der Vergleichsaufgabe 9.11 vs. 9.9

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 2 Minuten Lesezeit · Feb 19, 2025

572

Vor kurzem stellten Elon Musk und sein Team im Livestream Grok3 vor und bezeichneten es als die „intelligenteste künstliche Intelligenz der Erde“. Musk erklärte außerdem, dass Grok3 in Benchmark-Tests für Mathematik, Naturwissenschaften und Programmierung alle gängigen KI-Modelle übertrifft und für Berechnungen bei SpaceX-Marsmissionen eingesetzt werden soll. Er prognostizierte sogar einen Nobelpreis-würdigen Durchbruch innerhalb der nächsten drei Jahre.

Die Leistung von Grok3 in realen Tests war jedoch enttäuschend. Nach der Präsentation testeten einige Medien Grok3 und stellten eine klassische Frage: „Was ist größer: 9,11 oder 9,9?“. Überraschenderweise konnte die angeblich intelligenteste KI die richtige Antwort nicht geben, was bei den Nutzern zu Spott führte – „Ein Genie, das keine einfachen Fragen beantworten will“.

Musk antwortete darauf, dass Grok3 derzeit nur eine Testversion sei und in dieser Phase möglichst viele Fehler gemacht werden sollten. Die vollständige Version soll in den nächsten Monaten erscheinen.

Offizielle Angaben zeigen, dass Grok3 im Chatbot-Arena-Wettbewerb gut abgeschnitten hat, aber der Abstand zu den Konkurrenten DeepSeek R1 und GPT-4.0 nur bei 1% bis 2% liegt. Musk gab auf der Präsentation bekannt, dass für Grok3 über 200.000 H100-Chips verwendet wurden und die Gesamttrainingszeit zwei Millionen Stunden betrug.

OpenAI veröffentlicht GPT-4O-Audio-Preview: Sprachsteuerung mit Emotionserkennung!

OpenAI setzt erneut Maßstäbe in der KI-Technologie mit dem neuen Modell gpt-4o-audio-preview. Dieses Modell beeindruckt nicht nur durch seine Fähigkeiten in der Sprachgenerierung und -analyse, sondern eröffnet auch neue Möglichkeiten für die Mensch-Maschine-Interaktion. Werfen wir einen genaueren Blick auf die Eigenschaften und potenziellen Anwendungen dieses innovativen Modells. Die Kernfunktionen von gpt-4o-audio-preview lassen sich in drei Bereiche unterteilen: Erstens erzeugt es auf Basis von Text natürliche und flüssige Sprachantworten, was Anwendungen wie Sprachassistenten und virtuellen Kundenservice zugutekommt.

OpenAI neues Modell gpt-4o-2024-08-06 und gpt-4o-mini unterstützen strukturierte Ausgaben

OpenAI hat in seiner API die Funktion für strukturierte Ausgaben hinzugefügt, um sicherzustellen, dass die generierten Ausgaben vollständig dem vorgegebenen JSON-Schema entsprechen. Dies erhöht die Zuverlässigkeit der API und die Genauigkeit der Anwendungen deutlich. Diese Funktion definiert nicht nur die Struktur des JSON, sondern gewährleistet auch die Genauigkeit der Ausgabe. Gleichzeitig wurden die Preise gesenkt: Die Eingangs-Kosten wurden halbiert und die Ausgabe-Kosten um ein Drittel reduziert. Die Einführung strukturierter Ausgaben behebt die Einschränkungen von JSON-Schemas bei der Gewährleistung der Konformität der Ausgaben mit einer bestimmten Struktur und verbessert die Leistung des Modells bei strukturierten Ausgaben erheblich. Durch technologische Innovationen, wie z.B. Beschränkungen...

OpenAI veröffentlicht neues Modell gpt-4o-64k-output-alpha: GPT-4o API unterstützt nun bis zu 64K Output

Das herausragende Merkmal des neuen OpenAI-Modells gpt-4o-64k-output-alpha ist die Möglichkeit, bis zu 64K Tokens in einem einzigen Output zu generieren. Dies eignet sich ideal für die Erstellung umfangreicher und detaillierter Inhalte und erfüllt die Anforderungen von Schreibaufgaben, Programmierung und komplexen Datenanalysen. Diese Funktion erhöht jedoch den API-Preis: Die Kosten für eine Million Output-Tokens betragen 18 US-Dollar, im Vergleich dazu kosten eine Million Input-Tokens nur 6 US-Dollar. Dies soll den hohen Rechenkosten entsprechen und einen verantwortungsvollen Umgang mit diesem leistungsstarken Tool fördern. Das Modell ist für die Bereiche Kreativität und Forschung konzipiert.

KI-Nachrichten und -Informationen

Musks neuer Grok 3 enttäuscht mit fragwürdiger Intelligenz: Fehler bei der Vergleichsaufgabe 9.11 vs. 9.9

AIbase基地

Empfohlene verwandte KI-Nachrichten

OpenAI veröffentlicht GPT-4O-Audio-Preview: Sprachsteuerung mit Emotionserkennung!

OpenAI neues Modell gpt-4o-2024-08-06 und gpt-4o-mini unterstützen strukturierte Ausgaben

OpenAI veröffentlicht neues Modell gpt-4o-64k-output-alpha: GPT-4o API unterstützt nun bis zu 64K Output