Microsoft a testé la capacité de raisonnement moral des grands modèles linguistiques, et a constaté que les modèles de plus grande taille obtenaient de moins bons résultats dans le problème du tramway. Cependant, le modèle linguistique le plus puissant, GPT-4, a tout de même obtenu le meilleur score en matière d'éthique. Cette découverte est contraire aux hypothèses initiales des chercheurs.