El modelo o3 de OpenAI gana medalla de oro en la Olimpiada Internacional de Informática 2024

AIbase基地

Publicado elNoticias de IA · 5 minutos de lectura · Feb 13, 2025

220

Recientemente, OpenAI publicó un estudio sobre su nuevo modelo de razonamiento o3, demostrando cómo los modelos lingüísticos grandes (LLM) pueden pasar de ser programadores principiantes a competidores de nivel mundial. o3 obtuvo una puntuación de 2724 en la conocida plataforma de programación CodeForces, situándose en el percentil 99.8%, un rendimiento excepcional, y logró una puntuación de nivel medalla de oro en la Olimpiada Internacional de Informática (IOI) de 2024.

OpenAI

Nota de la imagen: Imagen generada por IA, proveída por Midjourney.

El estudio muestra que el modelo o3 superó en la competición IOI al modelo o1-ioi, específicamente ajustado para este evento. Este resultado indica que los logros obtenidos mediante el aprendizaje por refuerzo superan a las soluciones diseñadas manualmente. En la IOI 2024, o3 compitió bajo condiciones estándar y superó con éxito el umbral de la medalla de oro. Simultáneamente, se ubicó entre los 200 mejores programadores del mundo en CodeForces, compitiendo con los programadores humanos de élite.

Ethan Mollick, profesor asociado de la Wharton School, comentó: "La capacidad de razonamiento general desarrollada a través del aprendizaje por refuerzo ahora supera a las soluciones específicas de dominio cuidadosamente diseñadas. En lugar de construir sistemas especializados para tareas específicas, lograr resultados superiores con modelos grandes y generales mediante una capacidad de razonamiento más fuerte."

Esta investigación forma parte de la evaluación de OpenAI del rendimiento de sus modelos en la programación competitiva y en el campo más amplio de la ingeniería de software. Además, Anthropic publicó el lunes un informe sobre el impacto de la IA en el lugar de trabajo. El informe indica que aproximadamente el 36% de las ocupaciones utilizan IA en al menos el 25% de las tareas laborales, mientras que el 57% de las aplicaciones de IA mejoran las capacidades humanas y el 43% se centra en la automatización. Sin embargo, solo en el 4% de las ocupaciones, la IA se utiliza en al menos el 75% de las tareas laborales.

El estudio también indica que el desarrollo de software y la redacción técnica son los principales campos de aplicación de la IA, mientras que su papel es relativamente menor en tareas que implican interacción física con el entorno.

Puntos clave:
💻 El modelo o3 obtuvo una puntuación de 2724 en CodeForces, situándose en el percentil 99.8% y consiguiendo una medalla de oro en la Olimpiada Internacional de Informática.
📊 El aprendizaje por refuerzo supera las soluciones de diseño manual tradicional, demostrando la ventaja de la capacidad de razonamiento general.
📈 La IA se aplica ampliamente en el lugar de trabajo, siendo el desarrollo de software y la redacción técnica sus principales áreas, mientras que su aplicación en tareas de interacción física es menor.

Intangible, herramienta de creación 3D sin código, recibe una financiación de 4 millones de dólares

Intangible, una plataforma innovadora que permite la creación de contenido 3D sin necesidad de conocimientos de programación, ha anunciado una ronda de financiación de serie A por valor de 4 millones de dólares. Esta inversión impulsará el desarrollo de la plataforma y su expansión al mercado.

Quora Poe lanza función de aplicaciones de IA personalizadas; los usuarios pueden crear aplicaciones personalizadas con facilidad

Quora lanzó recientemente una nueva función en su plataforma de IA Poe que permite a los usuarios construir aplicaciones de IA personalizadas. Esta función, llamada "Aplicaciones Poe", permite a los usuarios crear interfaces visuales en la plataforma Poe mediante una simple descripción. Los usuarios pueden elegir diferentes modelos de IA para implementar sus ideas de aplicación. En la nueva herramienta de creación de aplicaciones, los usuarios solo necesitan describir la aplicación que desean crear, incluyendo la especificación del modelo de IA a utilizar, como el de OpenAI.

¡Compitiendo con DeepSeek y Claude! La función "Investigación Profunda" de OpenAI se lanza para todos los usuarios de pago de ChatGPT

OpenAI anunció recientemente la expansión de su función de Investigación Profunda (Deep Research) a todos los usuarios de ChatGPT Plus, Team, Education y Enterprise. Muchos expertos consideran esta función como el asistente de IA más transformador desde el lanzamiento de ChatGPT. Según la información oficial, estos usuarios recibirán 10 consultas de investigación profunda mensuales, mientras que los usuarios Pro tendrán acceso a 120 consultas mensuales. La Investigación Profunda utiliza Op...

OpenAI revela el proceso de razonamiento de o3-mini en respuesta al desafío de DeepSeek

OpenAI anunció recientemente la publicación del proceso de razonamiento detallado de su nuevo modelo de razonamiento o3-mini. Esta acción se considera una respuesta a la creciente presión competitiva de DeepSeek-R1. Este cambio representa un importante giro en la estrategia de transparencia de OpenAI. Anteriormente, OpenAI había mantenido en secreto la 'Cadena de Pensamiento' (Chain of Thought, CoT) como una ventaja competitiva clave. Sin embargo, a medida que modelos abiertos como DeepSeek-R1 muestran completamente sus trayectorias de razonamiento, esto...