Magma एक बहु-मोडल आधार मॉडल है जिसे Microsoft अनुसंधान टीम द्वारा विकसित किया गया है, जिसका उद्देश्य दृश्य, भाषा और क्रियाओं के संयोजन के माध्यम से जटिल कार्यों की योजना और निष्पादन को प्राप्त करना है। यह बड़े पैमाने पर दृश्य-भाषा डेटा के पूर्व-प्रशिक्षण के माध्यम से भाषा समझ, स्थानिक बुद्धिमत्ता और क्रिया योजना की क्षमता रखता है, और UI नेविगेशन, रोबोट संचालन जैसे कार्यों में उत्कृष्ट प्रदर्शन कर सकता है। इस मॉडल के आगमन ने बहु-मोडल AI एजेंट कार्यों के लिए एक शक्तिशाली मूल ढांचा प्रदान किया है, जिसमें व्यापक अनुप्रयोग संभावनाएं हैं।