¡El equipo de "Tongyi Qianwen" de Alibaba ha vuelto a dar una gran noticia! Acaban de lanzar el Qwen2Math Demo, un modelo matemático que es una auténtica maravilla, superando incluso a GPT-4.

Este modelo no solo puede procesar problemas matemáticos introducidos en texto, sino que también puede comprender fórmulas de imágenes y capturas de pantalla. Imagínese: ¡puede tomar una foto de una ecuación y obtener la solución! Una herramienta increíble para las clases de matemáticas (¡aunque no recomendamos hacer trampa, por supuesto!).

image.png

Qwen2-Math se presenta en tres versiones: 72B, 7B y 1.5B. La versión 72B es un genio de las matemáticas; en el conjunto de datos MATH, ¡superó a GPT-4 en 7 puntos, un 9.6% de mejora! Es como si sacaras 145 puntos en matemáticas en la prueba de acceso a la universidad, mientras que tu compañero de clase solo sacó 132.

Lo que es aún más impresionante es que la versión 7B, con menos de una décima parte de los parámetros, supera al modelo matemático de código abierto NuminaMath de 72B. Recordemos que NuminaMath ganó un premio en la primera AIMO mundial, un premio otorgado por el "gran gurú" de las matemáticas, Terence Tao.

Lin Junyang, experto en algoritmos senior de Alibaba, anunció con entusiasmo que habían convertido el modelo Qwen2 en un experto en matemáticas. ¿Cómo lo lograron? Utilizaron un "suero matemático" especial: un corpus de datos matemáticos especialmente diseñado. Este "suero" contiene una gran cantidad de textos matemáticos de alta calidad de internet, libros, códigos, exámenes, ¡incluso problemas matemáticos "creados" por el propio modelo Qwen2.

¿El resultado? En los conjuntos de pruebas matemáticas clásicas GSM8K y MATH, Qwen2-Math-72B superó a Llama-3.1 de 405B. Estos conjuntos de pruebas no son fáciles; incluyen problemas de álgebra, geometría, probabilidad, teoría de números y más.

Además, Qwen2-Math también desafió al conjunto de datos chino CMATH y a los exámenes de acceso a la universidad. En el conjunto de datos chino, incluso la versión 1.5B superó a Llama3.1 de 70B. Además, todas las versiones muestran una mejora significativa en el rendimiento en comparación con el modelo base Qwen2 del mismo tamaño.

Parece que "Tongyi Qianwen" realmente ha creado un genio de las matemáticas. ¿Podríamos preguntarle nuestros problemas de matemáticas en el futuro? Pero recordemos que es solo una herramienta; no nos dejemos cegar por su inteligencia, ¡debemos seguir practicando nuestras habilidades matemáticas!

Dirección de prueba en línea: https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo