AlphaMaze es un modelo de lenguaje decodificador específicamente diseñado para resolver tareas de razonamiento visual. A través del entrenamiento en tareas de resolución de laberintos, demuestra el potencial de los modelos de lenguaje en el razonamiento visual. Este modelo se basa en el modelo Qwen de 1.500 millones de parámetros y se entrena mediante ajuste fino supervisado (SFT) y aprendizaje por refuerzo (RL). Su principal ventaja radica en su capacidad para transformar tareas visuales en formato textual para la inferencia, compensando así las deficiencias de los modelos de lenguaje tradicionales en la comprensión espacial. El desarrollo de este modelo se centra en mejorar el rendimiento de la IA en tareas visuales, especialmente en escenarios que requieren razonamiento gradual. Actualmente, AlphaMaze es un proyecto de investigación y no tiene un precio comercial ni una posición en el mercado definidos.