GPT-4.5 asciende, pero pierde su favor en solo seis horas; xAI Grok-3 se lleva la victoria

El modelo GPT-4.5 de OpenAI alcanzó la cima de la arena de la inteligencia artificial apenas seis horas después de su lanzamiento, convirtiéndose en el número uno en la clasificación de tareas generales. Sin embargo, esta gloria fue efímera, ya que el modelo xAI Grok-3 de Musk rápidamente lo superó, convirtiéndose en el líder de la clasificación general.

Según los datos de votación, GPT-4.5 y Grok-3 obtuvieron más de 3000 votos cada uno, con un puntaje final de 1412 a 1411, una diferencia mínima. Aunque GPT-4.5 tuvo un rendimiento excelente en la mayoría de los proyectos, Grok-3 mostró una ligera ventaja en tareas específicas de "control de estilo" y "prompts difíciles", lo que le permitió superar en la puntuación total.

ChatGPT

Nota de la imagen: Imagen generada por IA, proveedor de servicios de licencias de imágenes Midjourney

Ante esta "remontada en seis horas", muchos usuarios expresaron sus dudas, cuestionando la legitimidad de un cambio tan rápido. Expertos de la industria explicaron que la clasificación tiene un umbral de votos, y solo los modelos que alcanzan los 3000 votos en el mismo período de tiempo pueden aparecer en la lista. Por lo tanto, el logro simultáneo de este estándar por parte de estos dos modelos, recién lanzados, fue una coincidencia.

Cabe destacar que, a pesar de las críticas negativas iniciales que recibió GPT-4.5 tras su lanzamiento, su aceptación por su alta inteligencia emocional aumentó significativamente con el tiempo. El CEO de OpenAI, Sam Altman, incluso compartió una conversación con GPT-4.5, afirmando que era la primera vez que un usuario le pedía que prometiera no retirar el modelo.

Simultáneamente, GPT-4.5 obtuvo un excelente rendimiento en una competición alternativa, participando en un juego similar al "Lobo Hombre entre los modelos de IA". En esta competición, los diferentes modelos de IA debatieron, elaboraron estrategias y votaron, y el ganador fue decidido por un jurado formado por los miembros eliminados. GPT-4.5 demostró un rendimiento superior al humano en colaboración, engaño y estrategia.

Todo esto demuestra que la competencia en el campo de la inteligencia artificial es cada vez más feroz, y los diferentes modelos están innovando y mejorando constantemente en sus respectivos campos. En el futuro, quién ganará esta batalla de la inteligencia es algo que merece nuestra atención continua.

Noticias de IA

GPT-4.5 asciende, pero pierde su favor en solo seis horas; xAI Grok-3 se lleva la victoria

AIbase基地