OpenAIs neue KI-Modelle o1-preview und o1-mini belegen Spitzenplätze im Chatbot-Ranking

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 3 Minuten Lesezeit · Sep 20, 2024

114

OpenAIs neue Systeme erzielten bei jüngsten Bewertungen herausragende Ergebnisse und belegten den ersten Platz im Chatbot-Ranking. Aufgrund der geringen Anzahl an Bewertungen könnte dies das Ergebnis jedoch verzerren.

Laut der veröffentlichten Übersicht schnitten die neuen Systeme in allen Bewertungskategorien hervorragend ab, darunter Gesamtperformance, Sicherheit und technische Fähigkeiten. Ein speziell für STEM-Aufgaben entwickeltes System belegte zusammen mit der im frühen September veröffentlichten GPT-4o-Version kurzzeitig den zweiten Platz und führte im technischen Bereich.

Chatbot Arena ist eine Plattform zum Vergleich verschiedener Systeme. Die neuen Systeme wurden anhand von über 6.000 Community-Bewertungen bewertet. Die Ergebnisse zeigen, dass die neuen Systeme bei mathematischen Aufgaben, komplexen Anweisungen und Programmieraufgaben hervorragend abschnitten.

Die neuen Systeme erhielten jedoch deutlich weniger Bewertungen als etabliertere Systeme wie GPT-4o oder Anthropic's Claude 3.5, wobei jedes System weniger als 3.000 Bewertungen aufwies. Eine so kleine Stichprobengröße kann die Bewertung verzerren und die Aussagekraft der Ergebnisse einschränken.

OpenAIs neue Systeme zeichnen sich in Mathematik und Codierung aus, den Hauptzielen ihres Designs. Durch längeres „Nachdenken“ vor der Beantwortung sollen diese Systeme neue Maßstäbe für KI-Schlussfolgerungen setzen. Diese Systeme sind jedoch nicht in allen Bereichen überlegen. Viele Aufgaben erfordern keine komplexe logische Schlussfolgerung, und manchmal reicht die schnelle Antwort anderer Systeme aus.

Das Diagramm von Lmsys zur Stärke mathematischer Modelle zeigt deutlich, dass diese neuen Systeme mit über 1360 Punkten die Leistung anderer Systeme deutlich übertrafen.

OpenAI veröffentlicht GPT-4O-Audio-Preview: Sprachsteuerung mit Emotionserkennung!

OpenAI setzt erneut Maßstäbe in der KI-Technologie mit dem neuen Modell gpt-4o-audio-preview. Dieses Modell beeindruckt nicht nur durch seine Fähigkeiten in der Sprachgenerierung und -analyse, sondern eröffnet auch neue Möglichkeiten für die Mensch-Maschine-Interaktion. Werfen wir einen genaueren Blick auf die Eigenschaften und potenziellen Anwendungen dieses innovativen Modells. Die Kernfunktionen von gpt-4o-audio-preview lassen sich in drei Bereiche unterteilen: Erstens erzeugt es auf Basis von Text natürliche und flüssige Sprachantworten, was Anwendungen wie Sprachassistenten und virtuellen Kundenservice zugutekommt.

OpenAI neues Modell gpt-4o-2024-08-06 und gpt-4o-mini unterstützen strukturierte Ausgaben

OpenAI hat in seiner API die Funktion für strukturierte Ausgaben hinzugefügt, um sicherzustellen, dass die generierten Ausgaben vollständig dem vorgegebenen JSON-Schema entsprechen. Dies erhöht die Zuverlässigkeit der API und die Genauigkeit der Anwendungen deutlich. Diese Funktion definiert nicht nur die Struktur des JSON, sondern gewährleistet auch die Genauigkeit der Ausgabe. Gleichzeitig wurden die Preise gesenkt: Die Eingangs-Kosten wurden halbiert und die Ausgabe-Kosten um ein Drittel reduziert. Die Einführung strukturierter Ausgaben behebt die Einschränkungen von JSON-Schemas bei der Gewährleistung der Konformität der Ausgaben mit einer bestimmten Struktur und verbessert die Leistung des Modells bei strukturierten Ausgaben erheblich. Durch technologische Innovationen, wie z.B. Beschränkungen...

OpenAI veröffentlicht neues Modell gpt-4o-64k-output-alpha: GPT-4o API unterstützt nun bis zu 64K Output

Das herausragende Merkmal des neuen OpenAI-Modells gpt-4o-64k-output-alpha ist die Möglichkeit, bis zu 64K Tokens in einem einzigen Output zu generieren. Dies eignet sich ideal für die Erstellung umfangreicher und detaillierter Inhalte und erfüllt die Anforderungen von Schreibaufgaben, Programmierung und komplexen Datenanalysen. Diese Funktion erhöht jedoch den API-Preis: Die Kosten für eine Million Output-Tokens betragen 18 US-Dollar, im Vergleich dazu kosten eine Million Input-Tokens nur 6 US-Dollar. Dies soll den hohen Rechenkosten entsprechen und einen verantwortungsvollen Umgang mit diesem leistungsstarken Tool fördern. Das Modell ist für die Bereiche Kreativität und Forschung konzipiert.

KI-Nachrichten und -Informationen

OpenAIs neue KI-Modelle o1-preview und o1-mini belegen Spitzenplätze im Chatbot-Ranking

AIbase基地

Empfohlene verwandte KI-Nachrichten

OpenAI veröffentlicht GPT-4O-Audio-Preview: Sprachsteuerung mit Emotionserkennung!

OpenAI neues Modell gpt-4o-2024-08-06 und gpt-4o-mini unterstützen strukturierte Ausgaben

OpenAI veröffentlicht neues Modell gpt-4o-64k-output-alpha: GPT-4o API unterstützt nun bis zu 64K Output