Después de 12 días de transmisiones en vivo compartiendo avances tecnológicos, OpenAI lanzó en su último día su modelo de razonamiento de próxima generación, o3. Esta es una versión mejorada del modelo de razonamiento o1 lanzado anteriormente. La serie de modelos o3 incluye dos versiones: o3 y o3-mini. o3-mini es una versión más pequeña y optimizada, ajustada para tareas específicas. OpenAI afirma que el modelo o3, bajo ciertas condiciones, puede acercarse a la inteligencia artificial general (AGI), es decir, una IA capaz de realizar cualquier tarea que un humano pueda realizar.

En la prueba de referencia de razonamiento lógico gráfico ARC-AGI, el modelo o3 obtuvo una puntuación récord: 75.7% en escenarios de bajo cálculo y 87.5% en pruebas de alto cálculo, superando el umbral del 85% que marca el nivel humano. En comparación, el modelo o1 obtuvo una puntuación de entre 25% y 32%, lo que significa que el rendimiento de o3 es casi el triple que el de o1. En Codeforces, una plataforma de concursos de codificación mundialmente famosa, o3 obtuvo una puntuación de 2727, mientras que o1 obtuvo solo 1891.

微信截图_20241223134833.png

Fu Sheng, presidente de OrionStar de Cheetah Mobile, afirmó que el lanzamiento de OpenAI o3 presagia la llegada de una era en la que todos serán programadores. Los usuarios podrán escribir programas sin necesidad de dominar Python o C, simplemente planteando sus necesidades y dejando que el gran modelo predictivo se encargue de la programación. Fu Sheng considera que el lanzamiento de o3 marca que la capacidad de programación de los grandes modelos de lenguaje supera a la del 99.9% de los programadores. En la competición de programación de nivel mundial Codeforces, o3 obtuvo un excelente puesto 175, mientras que o1 superó aproximadamente al 90% de los programadores, y GPT-4 solo superó al 11%.

OpenAI planea lanzar oficialmente el modelo o3 a finales de enero del próximo año. Fu Sheng señala que, aunque los programadores no desaparecerán por completo, su trabajo se centrará más en comprender las necesidades del usuario y construir una gran lógica, mientras que la tarea de convertir las necesidades en código será realizada en gran medida por la IA. Este lanzamiento indica que la aplicación de la IA en el campo de la programación será más amplia y también podría cambiar la forma en que trabajan los programadores.