El modelo WizardMath, desarrollado completamente por un equipo chino en Microsoft, es un modelo de código abierto de 70B parámetros. Utilizando instrucciones generadas por IA para un ajuste fino del modelo, ha superado en capacidad matemática a otros modelos grandes como ChatGPT, Claude Instant 1 y PaLM 2-540B.
El código fuente y el artículo del modelo WizardMath ya están disponibles en GitHub, atrayendo una amplia atención de la comunidad académica y de desarrolladores. El método empleado utiliza la técnica "Evil Instruction", generando automáticamente instrucciones de dominio abierto con diversos niveles de dificultad para mejorar el rendimiento del modelo.
Los autores también han desarrollado modelos para otros campos utilizando este método, como WizardCoder, enfocado en la capacidad de codificación.
El equipo de investigación está compuesto por varios científicos chinos, incluyendo investigadores del Instituto de Ingeniería de Internet de Microsoft Asia y Microsoft Research.