माइक्रोसॉफ्ट ने बड़े भाषा मॉडल की नैतिक तर्क क्षमता का परीक्षण किया, और ट्रॉली समस्या में बड़े मॉडल का प्रदर्शन छोटे मॉडलों की तुलना में खराब था। सबसे शक्तिशाली भाषा मॉडल GPT-4 का नैतिक स्कोर अभी भी सबसे ऊँचा है।