AlphaMaze ist ein Projekt, das sich auf die Verbesserung der visuellen Schlussfolgerungsfähigkeiten großer Sprachmodelle (LLMs) konzentriert. Es trainiert Modelle mithilfe von textbasierten Labyrinthaufgaben, um das Verständnis und die Planung räumlicher Strukturen zu ermöglichen. Diese Methode vermeidet komplexe Bildverarbeitung und bewertet die räumliche Auffassungsgabe des Modells direkt über Textbeschreibungen. Der Hauptvorteil besteht darin, dass aufgezeigt wird, wie das Modell über räumliche Probleme nachdenkt, und nicht nur, ob es diese lösen kann. Das Modell basiert auf einem Open-Source-Framework und zielt darauf ab, die Forschung und Entwicklung von Sprachmodellen im Bereich des visuellen Schlussfolgerns voranzutreiben.