7. August 2024, OpenAI gab heute die Einführung einer bahnbrechenden Funktion in seiner API bekannt: die strukturierte Ausgabe. Diese neue Funktion stellt sicher, dass die vom Modell generierten Ausgaben vollständig mit der vom Entwickler bereitgestellten JSON-Struktur übereinstimmen, wodurch die Zuverlässigkeit der API und die Genauigkeit der Anwendungen deutlich verbessert werden. Im Gegensatz zu früheren JSON-Schemata kann die strukturierte Ausgabe nicht nur das Schema von JSON (d. h. die Struktur der JSON-Ausgabe) definieren, sondern auch sicherstellen, dass die ausgegebene JSON-Datei zu 100 % korrekt ist. Gleichzeitig kündigte OpenAI eine Preissenkung für neue Modelle an: Die Eingabe kostet nur noch die Hälfte, und die Ausgabe ist um ein Drittel günstiger.
Technologische Innovation: Einführung der strukturierten Ausgabe
Im vergangenen Jahr führte OpenAI JSON-Schemata als leistungsstarkes Werkzeug für Entwickler zum Erstellen von Anwendungen ein. Obwohl JSON-Schemata die Wahrscheinlichkeit der Generierung gültiger JSON-Ausgaben erhöhten, konnten sie nicht garantieren, dass die Ausgaben einer bestimmten Struktur entsprachen. Die Einführung der strukturierten Ausgabe soll genau diese Einschränkung beheben. Durch die Einschränkung der Modell-Ausgabe auf die Übereinstimmung mit einem vorgegebenen Schema wird die Genauigkeit und Konsistenz der Ausgabedaten sichergestellt.
Leistungssteigerung: Bewertung und Vergleich
Bei der von OpenAI durchgeführten Nachverfolgung komplexer JSON-Schemata erzielte das neue Modell gpt-4o-2024-08-06 bei der strukturierten Ausgabe eine hervorragende Punktzahl von 100 %, während das alte Modell gpt-4-0613 weniger als 40 % erreichte. Dieser bemerkenswerte Fortschritt zeigt nicht nur den technologischen Sprung von OpenAI, sondern bietet Entwicklern auch höhere Effizienz und weniger Fehler.
Praktische Anwendung: Verwendung der strukturierten Ausgabe
Die OpenAI-API bietet zwei Formen der strukturierten Ausgabe:
1. Funktionsaufruf: Durch die Einrichtung in der Funktionsdefinition kann die strukturierte Ausgabe verwendet werden. Diese Funktion ist für alle Modelle mit Tool-Unterstützung verfügbar, einschließlich aller Modelle und höherer Versionen. Nach der Aktivierung der strukturierten Ausgabe stimmt die Modell-Ausgabe mit der bereitgestellten Tool-Definition überein.
API-Anfrageeinstellungen
API-Antwort
2. Neue Option des Parameters response_format: Entwickler können durch Bereitstellung des JSON-Schemas json_schema
als neue Option des Parameters eine strukturierte Antwort auf Benutzeranfragen erhalten.
Sicherheit und Support: Sichere strukturierte Ausgabe und SDK-Updates
Sicherheit hat bei OpenAI höchste Priorität. Die neue Funktion für die strukturierte Ausgabe entspricht den bestehenden Sicherheitsrichtlinien und ermöglicht es dem Modell, unsichere Anfragen bei Bedarf abzulehnen. Darüber hinaus wurden die Python- und Node-SDKs von OpenAI aktualisiert und unterstützen die strukturierte Ausgabe nativ, wodurch der Entwicklungsprozess vereinfacht wird.
Vielfältige Anwendungsfälle: Von dynamischen Benutzeroberflächen bis zur Datenextraktion
Die strukturierte Ausgabe ist äußerst vielseitig einsetzbar, z. B. zum dynamischen Generieren von Benutzeroberflächen basierend auf Benutzerabsichten, zum Trennen von Endergebnissen von unterstützenden Schlussfolgerungen und zum Extrahieren strukturierter Daten aus unstrukturierten Daten. Diese Anwendungsfälle zeigen die Praktikabilität und Flexibilität der strukturierten Ausgabe in verschiedenen Szenarien.
Technische Prinzipien: Eingeschränkte Decodierung und alternative Methoden
OpenAI hat durch die Verwendung der Technik der eingeschränkten Decodierung eine 100%ige Übereinstimmung zwischen der Modell-Ausgabe und dem JSON-Schema erreicht. Diese Methode gewährleistet durch dynamische Einschränkungen der Decodierung, dass das Modell in jedem Schritt nur gültige Token auswählen kann, wodurch die Wahrscheinlichkeit von Fehlern verringert wird.
Schlussfolgerung
Die Funktion der strukturierten Ausgabe von OpenAI bietet Entwicklern nicht nur ein zuverlässigeres und genaueres Werkzeug, sondern fördert auch den Fortschritt der künstlichen Intelligenz in der Datenverarbeitung und Anwendungsentwicklung. Mit der offiziellen Einführung dieser Funktion erwarten wir die Entstehung vieler innovativer Anwendungen.