¡Google Gemini Exp 1114 irrumpe en escena! Supera a GPT-4 en su debut, alcanzando la cima en múltiples evaluaciones y causando conmoción en la industria

AIbase基地

Publicado elNoticias de IA · 4 minutos de lectura · Nov 15, 2024

621

La versión experimental de Gemini (Exp1114) de Google DeepMind ha logrado resultados impresionantes en la plataforma Chatbot Arena. Después de más de una semana de pruebas comunitarias, con más de 6000 votos acumulados, este nuevo modelo ha superado significativamente a sus competidores, demostrando una capacidad asombrosa en varios ámbitos clave.

En la puntuación general, Gemini-Exp-1114 ha empatado en el primer lugar con GPT-4-latest con una excelente puntuación superior a 40, superando a la versión anterior líder, GPT-4-preview. Lo más sorprendente es que el modelo ha alcanzado la cima en áreas clave como matemáticas, instrucciones complejas y escritura creativa, mostrando una gran capacidad integral.

En detalle, el progreso de Gemini-Exp-1114 es impresionante:

Ha ascendido del tercer al primer puesto en la clasificación general.

Ha pasado del tercer al primer puesto en la evaluación de habilidades matemáticas.

Ha escalado del cuarto al primer puesto en el procesamiento de instrucciones complejas.

Ha mejorado del segundo al primer puesto en escritura creativa.

También ocupa el primer lugar en el procesamiento visual.

Su nivel de programación ha mejorado del quinto al tercer puesto.

Google AI Studio ya ha lanzado oficialmente esta nueva versión para que los usuarios la prueben. Sin embargo, la comunidad ha expresado preocupación por algunos problemas específicos, como la posible persistencia del límite de 1000 tokens y la gestión de la salida de textos muy largos en aplicaciones reales.

Los analistas del sector consideran que este avance significativo muestra que la inversión a largo plazo de Google en IA está dando sus frutos. Curiosamente, el modelo mantiene el cuarto puesto en el control de estilo, lo que podría indicar que el equipo de desarrollo ha empleado principalmente nuevos métodos de post-entrenamiento en lugar de modificar el modelo pre-entrenado.

Este gran avance también ha generado debate sobre la configuración del sector. OpenAI solía lanzar nuevos productos cuando sus competidores publicaban actualizaciones importantes, pero la magnitud del progreso de Google en esta ocasión ha llamado la atención de la industria. Algunos opinan que esto podría anunciar la llegada de Gemini 2, y que la competitividad de Google en el campo de los grandes modelos lingüísticos está aumentando considerablemente.

OpenAI lanza GPT-4O-Audio-Preview: ¡El audio también puede "leer" las emociones!

OpenAI lidera una vez más la innovación en inteligencia artificial con el lanzamiento de su nuevo modelo gpt-4o-audio-preview. Este modelo no solo muestra una capacidad asombrosa en la generación y el análisis de voz, sino que también abre nuevas posibilidades para la interacción humano-máquina. Exploremos las características y las aplicaciones potenciales de este innovador modelo. Las funciones principales de gpt-4o-audio-preview se dividen en tres áreas: en primer lugar, su capacidad para generar respuestas de voz naturales y fluidas a partir de texto, proporcionando una solución ideal para asistentes de voz y atención al cliente virtual...

La Copa América de Vela utiliza IA para 'visualizar' el viento

En la 37ª Copa América de Vela, el programa WindSightIQ se introdujo por primera vez en la transmisión televisiva. Utilizando LiDAR, fusión de sensores y computación científica, visualiza el campo de viento como gráficos de realidad aumentada y realidad virtual, ayudando a los espectadores a comprender los factores de viento cruciales en la navegación a vela. Si bien los marineros todavía dependen de la intuición y el entrenamiento para planificar sus rutas, los comentaristas y el público ahora pueden ver en tiempo real los patrones del viento, comparar el rendimiento real con la ruta óptima y participar en la regata a un nivel sin precedentes. Esta innovación ofrece una experiencia de visualización completamente nueva, haciendo visible lo que normalmente es invisible: el viento.

Nuevo modelo de OpenAI: gpt-4o-2024-08-06 y gpt-4o-mini con soporte para salida estructurada

OpenAI ha añadido una función de salida estructurada a su API, garantizando que la salida generada cumpla completamente con la estructura JSON predefinida. Esto mejora significativamente la fiabilidad de la API y la precisión de las aplicaciones. Esta función no solo define la estructura del JSON, sino que también asegura la exactitud de la salida. Simultáneamente, se ha reducido el precio; el coste de entrada se ha reducido a la mitad y el coste de salida en un tercio. La introducción de la salida estructurada resuelve las limitaciones del esquema JSON en cuanto a garantizar que la salida se ajuste a una estructura específica, mejorando notablemente el rendimiento del modelo en la salida estructurada. Gracias a innovaciones tecnológicas, como la limitación...

OpenAI lanza el nuevo modelo gpt-4o-64k-output-alpha: GPT-4o API ahora admite hasta 64K de salida

El punto más destacado del nuevo modelo gpt-4o-64k-output-alpha de OpenAI es su capacidad para generar una salida de hasta 64K tokens a la vez, ideal para contenido extenso y detallado, cubriendo necesidades en escritura, programación y análisis de datos complejos. Sin embargo, esta funcionalidad incrementa el precio de la API, con un coste de 18 dólares por millón de tokens de salida, en comparación con los 6 dólares por millón de tokens de entrada. Esta medida busca compensar los altos costes computacionales y fomentar el uso responsable de esta potente herramienta. El modelo es una gran ayuda para la creación y la investigación.