माइक्रोसॉफ्ट ने हाल ही में मल्टी-मोडल मॉडल LLaVA-1.5 जारी किया है, जिसमें क्रॉस-मोडल कनेक्टर और शैक्षणिक दृश्य प्रश्नोत्तर डेटासेट शामिल हैं, जिसने कई क्षेत्रों में सफल परीक्षण किए हैं। यह मॉडल न केवल ओपन-सोर्स मॉडलों के सर्वोच्च स्तर पर पहुंच गया है, बल्कि इसमें दृश्य, भाषा, जनरेटर आदि के कई मॉड्यूल भी शामिल हैं। परीक्षणों से पता चलता है कि LLaVA-1.5 का प्रदर्शन GPT-4V के समान है, यह एक रोमांचक तकनीकी सफलता है।