7 de agosto de 2024, OpenAI anunció hoy la introducción de una función innovadora en su API: la salida estructurada. Esta nueva función garantiza que la salida generada por el modelo cumpla completamente con el esquema JSON proporcionado por los desarrolladores, lo que mejora significativamente la fiabilidad de la API y la precisión de las aplicaciones. A diferencia de los esquemas JSON anteriores, la salida estructurada no solo define el esquema JSON (es decir, cómo es la estructura de la salida JSON), sino que también garantiza que la salida JSON sea 100% correcta. Simultáneamente, OpenAI anunció una reducción en los precios de los nuevos modelos: el precio de entrada se ha reducido a la mitad, y la salida es un 33% más barata.

image.png

Innovación tecnológica: Introducción de la salida estructurada

El año pasado, OpenAI presentó el esquema JSON como una herramienta poderosa para que los desarrolladores construyan aplicaciones. Sin embargo, aunque el esquema JSON mejoró la posibilidad de generar una salida JSON válida, no garantizaba que la salida cumpliera con una estructura específica. La introducción de la salida estructurada se diseñó para solucionar esta limitación, al restringir la salida del modelo para que coincida con el esquema preestablecido, garantizando así la precisión y la coherencia de los datos de salida.

Mejora del rendimiento: Evaluación y comparación

En la evaluación de seguimiento de OpenAI de esquemas JSON complejos, el nuevo modelo gpt-4o-2024-08-06 obtuvo una excelente puntuación de 100% en salida estructurada, mientras que el modelo anterior gpt-4-0613 obtuvo menos del 40%. Este progreso significativo no solo demuestra el avance tecnológico de OpenAI, sino que también ofrece a los desarrolladores una mayor eficiencia y una menor tasa de errores.

image.png

Aplicaciones prácticas: Cómo usar la salida estructurada

La API de OpenAI ha introducido dos formas de salida estructurada:

1. Llamadas a funciones: Se puede utilizar la salida estructurada configurando la definición de la función. Esta función es compatible con todos los modelos que admiten herramientas, incluidos todos los modelos y versiones posteriores. Al habilitar la salida estructurada, la salida del modelo coincidirá con la definición de la herramienta proporcionada.

carbon.png

Configuración de la solicitud de la API

carbon (1).png

Respuesta de la API

2. Nueva opción de parámetro response_format: Los desarrolladores pueden responder a las solicitudes de los usuarios de forma estructurada proporcionando el esquema JSON json_schema como una nueva opción de parámetro.

carbon (2).png

carbon (3).png

Seguridad y soporte: Salida estructurada segura y actualizaciones del SDK

La seguridad siempre es la prioridad principal de OpenAI. La nueva función de salida estructurada cumple con las políticas de seguridad existentes, permitiendo que el modelo rechace las solicitudes inseguras cuando sea necesario. Además, los SDK de Python y Node de OpenAI se han actualizado para admitir de forma nativa la salida estructurada, simplificando el proceso de desarrollo.

carbon (4).png

Casos de uso diversos: Desde interfaces dinámicas hasta extracción de datos

El alcance de aplicación de la salida estructurada es muy amplio, incluyendo la generación dinámica de interfaces de usuario según la intención del usuario, la separación de la respuesta final del razonamiento de apoyo, y la extracción de datos estructurados a partir de datos no estructurados. Estos casos de uso muestran la utilidad y la flexibilidad de la salida estructurada en diferentes escenarios.

Principios técnicos: Decodificación restringida y métodos alternativos

OpenAI ha implementado la coincidencia del 100% entre la salida del modelo y el esquema JSON mediante el uso de la técnica de decodificación restringida. Este método, mediante la restricción dinámica de la decodificación, garantiza que en cada paso el modelo solo pueda seleccionar tokens válidos, reduciendo así la posibilidad de errores.

Conclusión

La función de salida estructurada de OpenAI no solo proporciona a los desarrolladores una herramienta más fiable y precisa, sino que también impulsa el avance de la tecnología de inteligencia artificial en el procesamiento de datos y el desarrollo de aplicaciones. Con el lanzamiento oficial de esta función, esperamos ver el surgimiento de más aplicaciones innovadoras.