Se lanza la demo del modelo matemático Qwen2 Math de Tongyi Qianwen; la versión de 72B supera a GPT-4

AIbase基地

Publicado elNoticias de IA · 4 minutos de lectura · Aug 20, 2024

545

¡El equipo de "Tongyi Qianwen" de Alibaba ha vuelto a dar una gran noticia! Acaban de lanzar el Qwen2Math Demo, un modelo matemático que es una auténtica maravilla, superando incluso a GPT-4.

Este modelo no solo puede procesar problemas matemáticos introducidos en texto, sino que también puede comprender fórmulas de imágenes y capturas de pantalla. Imagínese: ¡puede tomar una foto de una ecuación y obtener la solución! Una herramienta increíble para las clases de matemáticas (¡aunque no recomendamos hacer trampa, por supuesto!).

Qwen2-Math se presenta en tres versiones: 72B, 7B y 1.5B. La versión 72B es un genio de las matemáticas; en el conjunto de datos MATH, ¡superó a GPT-4 en 7 puntos, un 9.6% de mejora! Es como si sacaras 145 puntos en matemáticas en la prueba de acceso a la universidad, mientras que tu compañero de clase solo sacó 132.

Lo que es aún más impresionante es que la versión 7B, con menos de una décima parte de los parámetros, supera al modelo matemático de código abierto NuminaMath de 72B. Recordemos que NuminaMath ganó un premio en la primera AIMO mundial, un premio otorgado por el "gran gurú" de las matemáticas, Terence Tao.

Lin Junyang, experto en algoritmos senior de Alibaba, anunció con entusiasmo que habían convertido el modelo Qwen2 en un experto en matemáticas. ¿Cómo lo lograron? Utilizaron un "suero matemático" especial: un corpus de datos matemáticos especialmente diseñado. Este "suero" contiene una gran cantidad de textos matemáticos de alta calidad de internet, libros, códigos, exámenes, ¡incluso problemas matemáticos "creados" por el propio modelo Qwen2.

¿El resultado? En los conjuntos de pruebas matemáticas clásicas GSM8K y MATH, Qwen2-Math-72B superó a Llama-3.1 de 405B. Estos conjuntos de pruebas no son fáciles; incluyen problemas de álgebra, geometría, probabilidad, teoría de números y más.

Además, Qwen2-Math también desafió al conjunto de datos chino CMATH y a los exámenes de acceso a la universidad. En el conjunto de datos chino, incluso la versión 1.5B superó a Llama3.1 de 70B. Además, todas las versiones muestran una mejora significativa en el rendimiento en comparación con el modelo base Qwen2 del mismo tamaño.

Parece que "Tongyi Qianwen" realmente ha creado un genio de las matemáticas. ¿Podríamos preguntarle nuestros problemas de matemáticas en el futuro? Pero recordemos que es solo una herramienta; no nos dejemos cegar por su inteligencia, ¡debemos seguir practicando nuestras habilidades matemáticas!

Dirección de prueba en línea: https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo

OpenAI lanza GPT-4O-Audio-Preview: ¡El audio también puede "leer" las emociones!

OpenAI lidera una vez más la innovación en inteligencia artificial con el lanzamiento de su nuevo modelo gpt-4o-audio-preview. Este modelo no solo muestra una capacidad asombrosa en la generación y el análisis de voz, sino que también abre nuevas posibilidades para la interacción humano-máquina. Exploremos las características y las aplicaciones potenciales de este innovador modelo. Las funciones principales de gpt-4o-audio-preview se dividen en tres áreas: en primer lugar, su capacidad para generar respuestas de voz naturales y fluidas a partir de texto, proporcionando una solución ideal para asistentes de voz y atención al cliente virtual...

Nuevo modelo de OpenAI: gpt-4o-2024-08-06 y gpt-4o-mini con soporte para salida estructurada

OpenAI ha añadido una función de salida estructurada a su API, garantizando que la salida generada cumpla completamente con la estructura JSON predefinida. Esto mejora significativamente la fiabilidad de la API y la precisión de las aplicaciones. Esta función no solo define la estructura del JSON, sino que también asegura la exactitud de la salida. Simultáneamente, se ha reducido el precio; el coste de entrada se ha reducido a la mitad y el coste de salida en un tercio. La introducción de la salida estructurada resuelve las limitaciones del esquema JSON en cuanto a garantizar que la salida se ajuste a una estructura específica, mejorando notablemente el rendimiento del modelo en la salida estructurada. Gracias a innovaciones tecnológicas, como la limitación...

OpenAI lanza el nuevo modelo gpt-4o-64k-output-alpha: GPT-4o API ahora admite hasta 64K de salida

El punto más destacado del nuevo modelo gpt-4o-64k-output-alpha de OpenAI es su capacidad para generar una salida de hasta 64K tokens a la vez, ideal para contenido extenso y detallado, cubriendo necesidades en escritura, programación y análisis de datos complejos. Sin embargo, esta funcionalidad incrementa el precio de la API, con un coste de 18 dólares por millón de tokens de salida, en comparación con los 6 dólares por millón de tokens de entrada. Esta medida busca compensar los altos costes computacionales y fomentar el uso responsable de esta potente herramienta. El modelo es una gran ayuda para la creación y la investigación.

Noticias de IA

Se lanza la demo del modelo matemático Qwen2 Math de Tongyi Qianwen; la versión de 72B supera a GPT-4

AIbase基地

Noticias de IA relacionadas recomendadas

OpenAI lanza GPT-4O-Audio-Preview: ¡El audio también puede "leer" las emociones!

Nuevo modelo de OpenAI: gpt-4o-2024-08-06 y gpt-4o-mini con soporte para salida estructurada

OpenAI lanza el nuevo modelo gpt-4o-64k-output-alpha: GPT-4o API ahora admite hasta 64K de salida